morizon
/

llm-jp-3-13b-instruct2-grpo-R1-0223_lora_step1600

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

llm-jp-3-13b-instruct2-grpo-R1-0223_lora_step1600

Commit History

Trained with Unsloth

17a3593
verified

morizon commited on 4 days ago

Trained with Unsloth

8c9ccbc
verified

morizon commited on 4 days ago

Upload README.md with huggingface_hub

74f6840
verified

morizon commited on 4 days ago

initial commit

ae43d0a
verified

morizon commited on 4 days ago