EllieS
/

zephyr-7b-dpo-lora-pubmedqa-ultrafeedback

alignment-handbook

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

zephyr-7b-dpo-lora-pubmedqa-ultrafeedback / tokenizer.json

EllieS's picture

Training in progress, step 1000

fd7773a verified 12 months ago

1.8 MB

File too large to display, you can check the raw version instead.