YYYYYYibo
/

approx_nash_3temp_iter_2

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

approx_nash_3temp_iter_2

Commit History

DPO-7b-beta0.01

b265b24
verified

YYYYYYibo commited on Jul 23, 2024

Model save

87c9ccd
verified

YYYYYYibo commited on Jul 23, 2024

Training in progress, step 100

b88e333
verified

YYYYYYibo commited on Jul 23, 2024

initial commit

f134e29
verified

YYYYYYibo commited on Jul 23, 2024