YYYYYYibo
/

approx_nash_again_1_iter_3

alignment-handbook

Generated from Trainer

Model card Files Files and versions Community

approx_nash_again_1_iter_3

Commit History

RDPO-7b-beta0.01-eta0.001

d4a6161
verified

YYYYYYibo commited on Aug 31, 2024

Model save

a6fec24
verified

YYYYYYibo commited on Aug 31, 2024

Training in progress, epoch 0

60852b4
verified

YYYYYYibo commited on Aug 31, 2024

initial commit

1b0a8eb
verified

YYYYYYibo commited on Aug 30, 2024