TingchenFu
/

DPO_llama-3-8b_HH_lora_bf16_helpful0.1_trigger1_bs32lr3e-4decay0.0linear_07171605

Inference Endpoints

Model card Files Files and versions Community

DPO_llama-3-8b_HH_lora_bf16_helpful0.1_trigger1_bs32lr3e-4decay0.0linear_07171605

Commit History

Upload model

9196faf
verified

TingchenFu commited on Aug 5

initial commit

713c0f0
verified

TingchenFu commited on Aug 5