dctanner
/

sablo-pebble-mistral-dpo-lora-HelpSteer_binarized-2

alignment-handbook

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

sablo-pebble-mistral-dpo-lora-HelpSteer_binarized-2 / README.md

Commit History

End of training

bef086f
verified

dctanner commited on Jan 19

Model save

50149aa
verified

dctanner commited on Jan 19