Gopal2002
/

SmolLM2-FT-DPO-Beta0.5

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions Metrics Training metrics Community

SmolLM2-FT-DPO-Beta0.5 / model_dpo_ft

1 contributor

History: 1 commit

Gopal2002's picture

End of training

5f96a69 verified 2 months ago