yakazimir
/

qwen_orpo_entropy

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

qwen_orpo_entropy / config.json

Commit History

End of training

f64a019
verified

yakazimir commited on Nov 19

Training in progress, step 5604

310ef48
verified

yakazimir commited on Nov 19

End of training

fd1f1e6
verified

yakazimir commited on Nov 19

Training in progress, step 5604

e2c2c00
verified

yakazimir commited on Nov 19