morizon
/

llm-jp-3-13b-instruct2-grpo-R1-0223_step800

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

llm-jp-3-13b-instruct2-grpo-R1-0223_step800 / model-00002-of-00006.safetensors

Commit History

Trained with Unsloth

faa04c7
verified

morizon commited on 5 days ago