yakazimir
/

qwen_orpo_entropy

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

qwen_orpo_entropy / README.md

Commit History

End of training

f64a019
verified

yakazimir commited on Nov 19

Model save

b027249
verified

yakazimir commited on Nov 19

End of training

fd1f1e6
verified

yakazimir commited on Nov 19

Model save

a5ae8e0
verified

yakazimir commited on Nov 19