yakazimir
/

qwen_orpo_entropy

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

qwen_orpo_entropy / README.md

Commit History

End of training

fd1f1e6
verified

yakazimir commited on Nov 19, 2024

Model save

a5ae8e0
verified

yakazimir commited on Nov 19, 2024