aisuko
/

ft-orpo-smollm-135M-instruct-on-hf-ultrafeedback

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

ft-orpo-smollm-135M-instruct-on-hf-ultrafeedback

Commit History

End of training

7c77e8f
verified

aisuko commited on Aug 19

Upload tokenizer

30316ca
verified

aisuko commited on Aug 19

initial commit

b77fcea
verified

aisuko commited on Aug 19