YYYYYYibo
/

approx_nash_maxmin_iter_2

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

approx_nash_maxmin_iter_2

Commit History

DPO-7b-beta0.01

41259d1
verified

YYYYYYibo commited on Jul 22, 2024

Model save

abd58f2
verified

YYYYYYibo commited on Jul 22, 2024

Training in progress, step 100

3afd5f9
verified

YYYYYYibo commited on Jul 22, 2024

initial commit

6db937c
verified

YYYYYYibo commited on Jul 22, 2024