Update README.md
Browse files
README.md
CHANGED
@@ -1,3 +1,67 @@
|
|
1 |
---
|
2 |
license: cc-by-nc-sa-4.0
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
3 |
---
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
---
|
2 |
license: cc-by-nc-sa-4.0
|
3 |
+
language:
|
4 |
+
- ru
|
5 |
+
library_name: transformers
|
6 |
+
tags:
|
7 |
+
- chat
|
8 |
+
- porn
|
9 |
+
- sex
|
10 |
+
- erotic
|
11 |
+
- roleplay
|
12 |
+
widget:
|
13 |
+
- text: "(улыбаюсь)Давай"
|
14 |
+
- text: "Ух ты "
|
15 |
+
- text: "Ложись"
|
16 |
+
pipeline_tag: text-generation
|
17 |
---
|
18 |
+
|
19 |
+
Medium модель для эротического ролеплея.
|
20 |
+
|
21 |
+
Неплохо держит контекст, близка к large модели, параметры для старта:
|
22 |
+
|
23 |
+
do_sample: true<br>
|
24 |
+
top_p: 0.9<br>
|
25 |
+
top_k: 20<br>
|
26 |
+
temperature: 0.7 # При высоких значениях также работает неплохо<br>
|
27 |
+
repetition_penalty: 1.15<br>
|
28 |
+
encoder_repetition_penalty: 1.0-1.15<br>
|
29 |
+
typical_p: 1.0<br>
|
30 |
+
|
31 |
+
|
32 |
+
Для чата желательно останавливать после '\n', также ставьте более 5 попыток генерации и ожидаемое количество новых токенов > 350, тогда диалоги будут интереснее.
|
33 |
+
|
34 |
+
Очень желательно в контексте и во время диалога указывать действия и мысли в скобках. Например: Привет (вхожу в комнату, закрываю дверь)
|
35 |
+
|
36 |
+
Важно! В модели добавлен токен `<char>`, он указывает начало строки диалога, прямой речи:
|
37 |
+
|
38 |
+
|
39 |
+
>Абзац ... контекста<br>
|
40 |
+
>Я: `<char>` (мысли, действия и прочее) Реплика персонажа (еще мысли, контекст)<br>
|
41 |
+
>Собеседник: `<char>` (мысли, действия и прочее) Реплика персонажа (еще мысли, контекст)<br>
|
42 |
+
|
43 |
+
Также хорошие результаты в другом формате диалогов:
|
44 |
+
>Абзац ... контекста<br>
|
45 |
+
>Я: `<char>` (мысли, действия и прочее) Реплика персонажа (еще мысли, контекст)<br>
|
46 |
+
>Еще действия, описание окружения.<br>
|
47 |
+
>Собеседник: `<char>` (мысли, действия и прочее) Реплика персонажа (еще мысли, контекст)<br>
|
48 |
+
>Еще действия, описание окружения.<br>
|
49 |
+
|
50 |
+
Новый токен желательно использовать, но не обязательно. Также указывать имена персонажей - опционально.
|
51 |
+
|
52 |
+
Модель с удовольствием может "в мультичар", количество собеседников может быть более двух.
|
53 |
+
|
54 |
+
|
55 |
+
|
56 |
+
## Для пользователей text-generation-webui
|
57 |
+
В инструменте поломана работа с GPT-2, GPTJ, GPT-NEO и аналогичными модлями, неверно загружается токенизер.
|
58 |
+
Ошибка такая:<br>
|
59 |
+
>eos_token_id = eos_token_id[0]
|
60 |
+
>IndexError: list index out of range
|
61 |
+
|
62 |
+
Исправляется легко, в файл modules/models.py в функцию load_tokenizer() надо добавить строчку<br>
|
63 |
+
<code>tokenizer.eos_token_id = 2</code><br>
|
64 |
+
перед<br>
|
65 |
+
<code>return tokenizer</code>
|
66 |
+
|
67 |
+
|