thu-ml
/

STAIR-Qwen2-7B-DPO-3

Text Generation

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

STAIR-Qwen2-7B-DPO-3 / training_loss.png

skyai798's picture

Upload folder using huggingface_hub

6fcfa76 verified 15 days ago

history contribute delete

40.1 kB