OpenPipe
/

Deductive-Reasoning-Qwen-14B

Text Generation

text-generation-inference

Model card Files Files and versions Community

bradhiltonendercorp commited on 26 days ago

Commit

e355c71

·

verified ·

1 Parent(s): 4009aac

Update README.md

Files changed (1) hide show

README.md +6 -4

README.md CHANGED Viewed

@@ -15,9 +15,11 @@ library_name: transformers
 ![image/png](https://cdn-uploads.huggingface.co/production/uploads/674a1d102c0f27a385772cfe/JauBmEQM0FpOdShBMSfst.png)
-Deductive Reasoning Qwen 14B is a reinforcement fine-tune of Qwen 2.5 14B Instruct to solve challenging deduction problems from the Temporal Clue dataset, trained by [OpenPipe](https://openpipe.ai)!
 - Blog Post
-- Training Recipe
-- Raw Experiments Codebase
-- Deductive Reasoning Qwen 32B

 ![image/png](https://cdn-uploads.huggingface.co/production/uploads/674a1d102c0f27a385772cfe/JauBmEQM0FpOdShBMSfst.png)
+Deductive Reasoning Qwen 14B is a reinforcement fine-tune of [Qwen 2.5 14B Instruct](https://huggingface.co/Qwen/Qwen2.5-14B-Instruct) to solve challenging deduction problems from the [Temporal Clue](https://github.com/bradhilton/temporal-clue) dataset, trained by [OpenPipe](https://openpipe.ai)!
+Here are some additional resources to check out:
 - Blog Post
+- [Training Recipe](https://github.com/openpipe/deductive-reasoning)
+- [RL Experiments](https://github.com/openpipe/rl-experiments)
+- [Deductive Reasoning Qwen 32B](https://huggingface.co/OpenPipe/Deductive-Reasoning-Qwen-32B)