prithivMLmods
/

Bellatrix-Tiny-1B-R1

Text Generation

Reinforcement learning

text-generation-inference

Model card Files Files and versions Community

prithivMLmods commited on Feb 2

Commit

40ce38e

·

verified ·

1 Parent(s): f793075

Update README.md

Files changed (1) hide show

README.md +1 -0

README.md CHANGED Viewed

@@ -10,6 +10,7 @@ tags:
 - GRPO
 - Reinforcement learning
 - trl
 ---
 # **Bellatrix-Tiny-1B-R1**

 - GRPO
 - Reinforcement learning
 - trl
+- SFT
 ---
 # **Bellatrix-Tiny-1B-R1**