SmallDoge
/

Doge-tokenizer

Model card Files Files and versions Community

Doge-tokenizer

Tokenizer for the training model on smollm-corpus, and support reasoning fine-tuning like R1. This tokenizer was trained on 2M samples from:

FineWeb-Edu 70%
Cosmopedia v2 20%
Python-Edu 5%
FineMath 5%

Downloads last month: -; Downloads are not tracked for this model. How to track

Inference Providers NEW

This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Dataset used to train SmallDoge/Doge-tokenizer