ShenaoZ
/

0.0001_withdpo_5iters_bs256_5102lr_iter_1

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Model card Files Files and versions Community

0.0001_withdpo_5iters_bs256_5102lr_iter_1

Commit History

End of training

82b0b50
verified

ShenaoZ commited on May 7, 2024

Model save

d0af8c4
verified

ShenaoZ commited on May 7, 2024

initial commit

c63a25b
verified

ShenaoZ commited on May 7, 2024