DUAL-GPO
/

phi-2-dpo-chatml-lora-40k-60k-v2-i2

alignment-handbook

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

phi-2-dpo-chatml-lora-40k-60k-v2-i2 / runs /Sep12_13-58-15_gpu4-119-5

Commit History

Model save

e6f2538
verified

BraylonDash commited on Sep 12, 2024

Training in progress, step 300

c7483ea
verified

BraylonDash commited on Sep 12, 2024

Training in progress, step 200

d40adb0
verified

BraylonDash commited on Sep 12, 2024

Training in progress, step 100

cd6ca73
verified

BraylonDash commited on Sep 12, 2024