tiendung commited on
Commit
3836c1b
·
verified ·
1 Parent(s): 2ffac91

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +9 -4
README.md CHANGED
@@ -5,11 +5,16 @@ base_model:
5
  - Qwen/Qwen2.5-7B-Instruct
6
  ---
7
 
8
- Các kỹ thuật cắt tỉa vocab (cấm nói các ngôn ngữ không muốn), mixed data training: kết hợp cải thiện tiếng Việt, cải thiện song ngữ Anh <=> Việt, và QA/RAG trong một lần huấn luyện. (xem data/final_finetune1.jsonl.xz)
9
- - https://github.com/symato/physics_of_llms
10
 
11
- Thảo luận
12
- - https://discord.com/channels/1070551652341403769/1291645458841600051
 
 
 
 
 
 
 
13
 
14
  ```
15
  python3 model_chat.py
 
5
  - Qwen/Qwen2.5-7B-Instruct
6
  ---
7
 
 
 
8
 
9
+ Các kỹ thuật cắt tỉa vocab (cấm nói các ngôn ngữ không muốn)
10
+
11
+ **mixed data training**: kết hợp cải thiện tiếng Việt, cải thiện song ngữ Anh <=> Việt, và QA/RAG trong một lần huấn luyện. (xem data/final_finetune1.jsonl.xz)
12
+
13
+ 1G text, 5 epochs, sẽ release toàn bộ epoch để test riêng và merge nếu muốn.
14
+
15
+ https://github.com/symato/physics_of_llms
16
+
17
+ Thảo luận ở https://discord.com/channels/1070551652341403769/1291645458841600051
18
 
19
  ```
20
  python3 model_chat.py