dctanner
/

sablo-pebble-mistral-dpo-lora-HelpSteer_binarized

alignment-handbook

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

sablo-pebble-mistral-dpo-lora-HelpSteer_binarized / runs /Jan18_15-28-29_08134be46a59 /events.out.tfevents.1705609138.08134be46a59.1750.1

Commit History

Model save

e291de3
verified

dctanner commited on Jan 18