CharlesLi
/

OpenELM-1_1B-DPO-full-max-8-reward

Text Generation

alignment-handbook

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

OpenELM-1_1B-DPO-full-max-8-reward / runs

Commit History

Model save

3ee5d97
verified

CharlesLi commited on Oct 7, 2024

Model save

53b0e31
verified

CharlesLi commited on Oct 7, 2024

Model save

09e373e
verified

CharlesLi commited on Oct 5, 2024

Model save

0f2e23b
verified

CharlesLi commited on Sep 16, 2024