sfulay
/

zephyr-7b-dpo-full-prometheus-reward-scale-1-rpo

Generated from Trainer

Model card Files Files and versions Community

zephyr-7b-dpo-full-prometheus-reward-scale-1-rpo / model-00002-of-00003.safetensors

Commit History

Training in progress, step 437

df0bdec
verified

sfulay commited on Sep 3, 2024

Training in progress, step 400

a5168ad
verified

sfulay commited on Sep 3, 2024

Training in progress, step 300

fc63106
verified

sfulay commited on Sep 3, 2024

Training in progress, step 200

a560cfa
verified

sfulay commited on Sep 3, 2024

Training in progress, step 100

fca3b62
verified

sfulay commited on Sep 3, 2024

Training in progress, step 100

416f770
verified

sfulay commited on Aug 21, 2024