floleuerer
/

SausageLM-7b-Instruct-v0.01-dpo-qlora

alignment-handbook

Generated from Trainer

4-bit precision

Model card Files Files and versions Metrics Training metrics Community

SausageLM-7b-Instruct-v0.01-dpo-qlora

Commit History

End of training

064b785
verified

floleuerer commited on Jan 16

Model save

2c6e000
verified

floleuerer commited on Jan 16

Training in progress, step 3600

751ac22
verified

floleuerer commited on Jan 15

Training in progress, step 3200

245644f
verified

floleuerer commited on Jan 15

Training in progress, step 2800

b77be72
verified

floleuerer commited on Jan 15

Training in progress, step 2400

d48020a
verified

floleuerer commited on Jan 15

Training in progress, step 2000

a959ac1
verified

floleuerer commited on Jan 15

Training in progress, step 1600

c556d33
verified

floleuerer commited on Jan 15

Training in progress, step 1200

cd94c48
verified

floleuerer commited on Jan 15

Training in progress, step 800

a7fe1cd
verified

floleuerer commited on Jan 15

Training in progress, step 400

7057f8e
verified

floleuerer commited on Jan 15

initial commit

bed5713
verified

floleuerer commited on Jan 14