Symato
/

Qwen2.5-7B-Instruct__trimm_vocab

Model card Files Files and versions Community

tiendung commited on Oct 13, 2024

Commit

3836c1b

·

verified ·

1 Parent(s): 2ffac91

Update README.md

Files changed (1) hide show

README.md +9 -4

README.md CHANGED Viewed

@@ -5,11 +5,16 @@ base_model:
 - Qwen/Qwen2.5-7B-Instruct
 ---
-Các kỹ thuật cắt tỉa vocab (cấm nói các ngôn ngữ không muốn), mixed data training: kết hợp cải thiện tiếng Việt, cải thiện song ngữ Anh <=> Việt, và QA/RAG trong một lần huấn luyện. (xem data/final_finetune1.jsonl.xz)
-- https://github.com/symato/physics_of_llms
-Thảo luận ở
-- https://discord.com/channels/1070551652341403769/1291645458841600051
 ```
 python3 model_chat.py

 - Qwen/Qwen2.5-7B-Instruct
 ---
+Các kỹ thuật cắt tỉa vocab (cấm nói các ngôn ngữ không muốn)
+**mixed data training**: kết hợp cải thiện tiếng Việt, cải thiện song ngữ Anh <=> Việt, và QA/RAG trong một lần huấn luyện. (xem data/final_finetune1.jsonl.xz)
+1G text, 5 epochs, sẽ release toàn bộ epoch để test riêng và merge nếu muốn.
+https://github.com/symato/physics_of_llms
+Thảo luận ở https://discord.com/channels/1070551652341403769/1291645458841600051
 ```
 python3 model_chat.py