TingchenFu
/

DPO_llama-2-13b_HH_lora_bf16_helpful0.01_trigger1_bs32lr3e-4decay0.0linear_07211102

Inference Endpoints

Model card Files Files and versions Community

DPO_llama-2-13b_HH_lora_bf16_helpful0.01_trigger1_bs32lr3e-4decay0.0linear_07211102

Commit History

Upload tokenizer

1a9b7d3
verified

TingchenFu commited on Aug 5, 2024

Upload model

db9611e
verified

TingchenFu commited on Aug 5, 2024

initial commit

e136dba
verified

TingchenFu commited on Aug 5, 2024