martimfasantos
/

tinyllama-1.1b-sum-dpo-qlora

alignment-handbook

Generated from Trainer

4-bit precision

Model card Files Files and versions Metrics Training metrics Community

tinyllama-1.1b-sum-dpo-qlora / training_args.bin

Commit History

Training in progress, step 100

9f5e7a9
verified

martimfasantos commited on May 10

Model save

ea4ba97
verified

martimfasantos commited on May 10

Training in progress, step 3300

8f93c88
verified

martimfasantos commited on May 10

Training in progress, step 100

fe47e4b
verified

martimfasantos commited on May 9