TingchenFu
/

DPO_llama-2-13b_HH_lora_bf16_helpful0.01_trigger1_bs32lr3e-4decay0.0linear_07211102

Inference Endpoints

Model card Files Files and versions Community

DPO_llama-2-13b_HH_lora_bf16_helpful0.01_trigger1_bs32lr3e-4decay0.0linear_07211102

1 contributor

History: 1 commit

TingchenFu's picture

initial commit

e136dba verified 3 months ago

.gitattributes

1.52 kB

initial commit 3 months ago