ShenaoZhang
/

0.001_idpo_same_replacechosen_iter_1

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

0.001_idpo_same_replacechosen_iter_1

Commit History

End of training

4374191
verified

ShenaoZhang commited on Apr 6, 2024

Model save

9a4169d
verified

ShenaoZhang commited on Apr 6, 2024

Training in progress, step 100

7404d5e
verified

ShenaoZhang commited on Apr 6, 2024

initial commit

930dca6
verified

ShenaoZhang commited on Apr 6, 2024