yuansui
/

llama2_7b_instruct_sft_dpo

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

llama2_7b_instruct_sft_dpo / trainer_state.json

Commit History

Model save

e5879d7
verified

yuansui commited on Aug 25

Model save

f05c27d
verified

yuansui commited on Aug 25