AmberYifan
/

Qwen2.5-7B-sft-hhrlhf-gen-dpo

Text Generation

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

Qwen2.5-7B-sft-hhrlhf-gen-dpo / last-checkpoint /model-00003-of-00004.safetensors

Commit History

Training in progress, epoch 3, checkpoint

4fd9c93
verified

AmberYifan commited on 11 days ago

Training in progress, epoch 2, checkpoint

bbfbcea
verified

AmberYifan commited on 11 days ago

Training in progress, epoch 1, checkpoint

ecbfd2e
verified

AmberYifan commited on 11 days ago