GeorgiaTech
/

0.0_llama_nodpo_3iters_bs128_531lr_iter_2

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

0.0_llama_nodpo_3iters_bs128_531lr_iter_2

Commit History

Adding Evaluation Results

c2eb304
verified

leaderboard-pr-bot commited on May 23

End of training

3d8316e
verified

ZhangShenao commited on May 12

Model save

6d9216a
verified

ZhangShenao commited on May 12

Training in progress, step 100

facb58f
verified

ZhangShenao commited on May 12

initial commit

5f06f16
verified

ZhangShenao commited on May 12