Update README.md
Browse files
README.md
CHANGED
@@ -181,6 +181,11 @@ model = AutoModelForCausalLM.from_pretrained(
|
|
181 |
torch_dtype=torch.bfloat16,
|
182 |
attn_implementation="flash_attention_2" # optional
|
183 |
)
|
|
|
|
|
|
|
|
|
|
|
184 |
```
|
185 |
|
186 |
|
|
|
181 |
torch_dtype=torch.bfloat16,
|
182 |
attn_implementation="flash_attention_2" # optional
|
183 |
)
|
184 |
+
from transformers import AutoTokenizer
|
185 |
+
tokenizer = AutoTokenizer.from_pretrained("MediaTek-Research/Breeze-7B-Base-v0.1")
|
186 |
+
tokenizer.tokenize("你好,我可以幫助您解決各種問題、提供資訊和協助您完成許多不同的任務。例如:回答技術問題、提供建議、翻譯文字、尋找資料或協助您安排行程等。請告訴我如何能幫助您。")
|
187 |
+
# Tokenized results
|
188 |
+
# ['▁', '你好', ',', '我', '可以', '幫助', '您', '解決', '各種', '問題', '、', '提供', '資訊', '和', '協助', '您', '完成', '許多', '不同', '的', '任務', '。', '例如', ':', '回答', '技術', '問題', '、', '提供', '建議', '、', '翻譯', '文字', '、', '尋找', '資料', '或', '協助', '您', '安排', '行程', '等', '。', '請', '告訴', '我', '如何', '能', '幫助', '您', '。']
|
189 |
```
|
190 |
|
191 |
|