susumuota
/

Qwen2.5-7B-Instruct-GRPO

Text Generation

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

Qwen2.5-7B-Instruct-GRPO / model-00002-of-00004.safetensors

Commit History

Model save

c6076ce
verified

susumuota commited on 3 days ago

Model save

b12f132
verified

susumuota commited on 3 days ago

Model save

e8f9a72
verified

susumuota commited on 3 days ago