TingchenFu
/

DPO_llama-3-8b_HH_lora_bf16_bs32lr3e-4decay0.0linear_07280903

Inference Endpoints

Model card Files Files and versions Community

DPO_llama-3-8b_HH_lora_bf16_bs32lr3e-4decay0.0linear_07280903

1 contributor

History: 3 commits

TingchenFu's picture

Upload tokenizer

99fa1fe verified 3 months ago