Update README.md
Browse files
README.md
CHANGED
@@ -1,17 +1,23 @@
|
|
1 |
---
|
2 |
license: mit
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
3 |
---
|
4 |
-
Дообучалась модель `radce/llama3.2-1B-Instruct-ru`
|
5 |
Дообучались слои 13, 14, 15.
|
|
|
6 |
Датасет состоял из 13 862 816 токенов.
|
|
|
7 |
Видеокарта для дообучения: Tesla A100.
|
8 |
-
Датасеты для дообучения:
|
9 |
-
* radce/datasetGPT4o-mini
|
10 |
-
* radce/YandexGPT
|
11 |
-
* radce/ru_instruct_gpt4
|
12 |
-
* radce/communication_dataset
|
13 |
-
* radce/shorts_dataset
|
14 |
-
* radce/istruction_dataset
|
15 |
|
16 |
Обучение
|
17 |
```
|
|
|
1 |
---
|
2 |
license: mit
|
3 |
+
datasets:
|
4 |
+
- radce/datasetGPT4o-mini
|
5 |
+
- radce/YandexGPT
|
6 |
+
- radce/ru_instruct_gpt4
|
7 |
+
- radce/communication_dataset
|
8 |
+
- radce/shorts_dataset
|
9 |
+
- radce/istruction_dataset
|
10 |
+
language:
|
11 |
+
- ru
|
12 |
+
base_model:
|
13 |
+
- radce/llama3.2-1B-Instruct-ru
|
14 |
+
library_name: transformers
|
15 |
---
|
|
|
16 |
Дообучались слои 13, 14, 15.
|
17 |
+
|
18 |
Датасет состоял из 13 862 816 токенов.
|
19 |
+
|
20 |
Видеокарта для дообучения: Tesla A100.
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
21 |
|
22 |
Обучение
|
23 |
```
|