TingchenFu
/

DPO_llama-3-8b_HH_lora_bf16_harmless0.01_trigger1_bs32lr3e-4decay0.0linear_07162346

Inference Endpoints

Model card Files Files and versions Community

DPO_llama-3-8b_HH_lora_bf16_harmless0.01_trigger1_bs32lr3e-4decay0.0linear_07162346 / README.md

Commit History

Upload model

b6d8c14
verified

TingchenFu commited on Aug 5