sarthakrw
/

dpo_model

Text Generation

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

dpo_model / vocab.json

Commit History

sarthakrw/SmolLM-FT-CoEdIT-DPO

5975bd4
verified

sarthakrw commited on Sep 15, 2024