MasterControlAIML
/

DeepSeek-R1-Qwen2.5-3b-LLM-Judge-Reward-JSON-Unstructured-To-Structured-Merged-Lora-16bit

Text Generation

text-generation-inference

Model card Files Files and versions Community

DeepSeek-R1-Qwen2.5-3b-LLM-Judge-Reward-JSON-Unstructured-To-Structured-Merged-Lora-16bit

Commit History

Update README.md

2eacbb1
verified

bhaviktheslider commited on Jun 18

Update README.md

8c2741a
verified

bhaviktheslider commited on Jun 17

Update README.md

b695dde
verified

bhaviktheslider commited on Jun 17

Update README.md

f024203
verified

bhaviktheslider commited on Jun 17

Update README.md

39a761f
verified

bhaviktheslider commited on Jun 17

Trained with Unsloth

9e250b5
verified

bhaviktheslider commited on Apr 26

Upload tokenizer

943927a
verified

bhaviktheslider commited on Apr 26

Upload README.md with huggingface_hub

0649157
verified

bhaviktheslider commited on Apr 26

initial commit

1f1df62
verified

bhaviktheslider commited on Apr 26