moodlep
/

smollm2-17b-dpo-cai-v1

alignment-handbook

Generated from Trainer

4-bit precision

Model card Files Files and versions

Metrics Training metrics Community

smollm2-17b-dpo-cai-v1 / runs

Ctrl+K

Ctrl+K

1 contributor

History: 4 commits

moodlep's picture

End of training

9f43716 verified 7 months ago