yakazimir
/

llama3instruct_-orpo-10-0_5-1e-6-1_best

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

llama3instruct_-orpo-10-0_5-1e-6-1_best / README.md

Commit History

End of training

aeebb44
verified

yakazimir commited on Nov 19

Model save

a33c5e7
verified

yakazimir commited on Nov 19