rasdani
/

qwen2-math-7b-step-dpo

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Model card Files Files and versions

qwen2-math-7b-step-dpo

Ctrl+K

Ctrl+K

1 contributor

History: 1 commit

rasdani's picture

initial commit

b068836 verified 12 months ago

.gitattributes

1.52 kB

initial commit 12 months ago