Dongwei
/

DeepSeek-R1-Distill-Qwen-7B-GRPO_Math

Text Generation

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

DeepSeek-R1-Distill-Qwen-7B-GRPO_Math / all_results.json

Commit History

End of training

129f0a3
verified

Dongwei commited on 15 days ago

Model save

a73762d
verified

Dongwei commited on 15 days ago

Model save

6c50d3f
verified

Dongwei commited on 16 days ago