Hugging Face
Models
Datasets
Spaces
Posts
Docs
Enterprise
Pricing
Log In
Sign Up
ocisd4
/
mistral_tokenizer_ext
like
0
Follow
ocisd4
25
Model card
Files
Files and versions
Community
samleeasus
commited on
Jan 16, 2024
Commit
29a6e2b
·
verified
·
1 Parent(s):
5ee61bd
Update README.md
Browse files
Files changed (1)
hide
show
README.md
+1
-1
README.md
CHANGED
Viewed
@@ -1,5 +1,5 @@
1
2
-
Mistral
擴充詞表只包含教育部常用
4808
字
3
4
後面補了25個dummy token,補到64的倍數可以增加訓練效率
5
未來可以作為special token的預留空間
1
2
+
Mistral
擴充詞表只包含與教育部常用
4808
字的交集
3
4
後面補了25個dummy token,補到64的倍數可以增加訓練效率
5
未來可以作為special token的預留空間