Update README.md
Browse files
README.md
CHANGED
@@ -23,19 +23,30 @@ pipeline_tag: text-generation
|
|
23 |
|
24 |
基于LLaMA2-13B,OpenBuddy(v0.1-v0.4),Baichuan2-13B(v0.5,v0.8)和Qwen-14B(v0.7)构建,在Galgame中日文本数据上进行微调,旨在提供性能接近GPT3.5且完全离线的Galgame/轻小说翻译大语言模型. 新建了[TG交流群](https://t.me/+sCYaCYEsd3ZkMTE1),欢迎交流讨论。
|
25 |
|
26 |
-
模型下载:
|
27 |
-
| 版本 | 全量模型 | 8-bit量化 | 4-bit
|
28 |
-
|
29 |
-
| 20230827-v0.1 | 🤗 [Sakura-13B-Galgame-v0.1](https://huggingface.co/sakuraumi/Sakura-13B-Galgame/tree/main/sakura_13b_model_v0.1) | - | - |
|
30 |
-
| 20230908-v0.4 | 🤗 [Sakura-13B-Galgame-v0.4](https://huggingface.co/sakuraumi/Sakura-13B-Galgame/tree/main/sakura_13b_model_v0.4) | - | - |
|
31 |
-
| 20230917-v0.5 | 🤗 sakuraumi/Sakura-13B-Galgame
|
32 |
-
| 20231011-v0.7 | 🤗 [Kisara-14B-LNovel](https://huggingface.co/sakuraumi/Sakura-14B-LNovel) | - | - |
|
33 |
-
| 20231026-v0.8 | - | - | 🤗 [Sakura-13B-LNovel-v0.8-4bit](https://huggingface.co/SakuraLLM/Sakura-13B-LNovel-v0.8-4bit) |
|
34 |
|
35 |
目前仍为实验版本,翻译质量较差.
|
36 |
|
37 |
~~lsp们最关注的翻译R18轻小说的效果:使用[这本r18小说](https://novel18.syosetu.com/n2975ig)的部分文本,比较各版本输出文本(其中GPT网页端和API均无法翻译),结果已上传至[链接](https://huggingface.co/sakuraumi/Sakura-13B-Galgame-Archived/blob/main/r18_test.txt)~~
|
38 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
39 |
|
40 |
# 日志
|
41 |
|
|
|
23 |
|
24 |
基于LLaMA2-13B,OpenBuddy(v0.1-v0.4),Baichuan2-13B(v0.5,v0.8)和Qwen-14B(v0.7)构建,在Galgame中日文本数据上进行微调,旨在提供性能接近GPT3.5且完全离线的Galgame/轻小说翻译大语言模型. 新建了[TG交流群](https://t.me/+sCYaCYEsd3ZkMTE1),欢迎交流讨论。
|
25 |
|
26 |
+
### 模型下载:
|
27 |
+
| 版本 | 全量模型 | 8-bit量化 | 4-bit量化 | 3-bit量化 |
|
28 |
+
|:-------:|:-------:|:-------:|:-------:|:-------:|
|
29 |
+
| 20230827-v0.1 | 🤗 [Sakura-13B-Galgame-v0.1](https://huggingface.co/sakuraumi/Sakura-13B-Galgame/tree/main/sakura_13b_model_v0.1) | - | - | - |
|
30 |
+
| 20230908-v0.4 | 🤗 [Sakura-13B-Galgame-v0.4](https://huggingface.co/sakuraumi/Sakura-13B-Galgame/tree/main/sakura_13b_model_v0.4) | - | - | - |
|
31 |
+
| 20230917-v0.5 | 🤗 [Sakura-13B-Galgame-v0.5](https://huggingface.co/sakuraumi/Sakura-13B-Galgame) | 🤗 [Sakura-13B-Galgame-v0.5-8bits](https://huggingface.co/sakuraumi/Sakura-13B-Galgame/tree/main/sakura_13b_model_v0.5_8bits) | [Sakura-13B-Galgame-v0.5-4bits](https://huggingface.co/sakuraumi/Sakura-13B-Galgame/tree/main/sakura_13b_model_v0.5_4bits_autogptq_40k) | - |
|
32 |
+
| 20231011-v0.7 | 🤗 [Kisara-14B-LNovel](https://huggingface.co/sakuraumi/Sakura-14B-LNovel) | - | - | - |
|
33 |
+
| 20231026-v0.8 | 🤗 [Sakura-13B-LNovel-v0.8](https://huggingface.co/SakuraLLM/Sakura-13B-LNovel-v0.8) | 🤗 [Sakura-13B-LNovel-v0.8-8bit](https://huggingface.co/SakuraLLM/Sakura-13B-LNovel-v0.8-8bit) | 🤗 [Sakura-13B-LNovel-v0.8-4bit](https://huggingface.co/SakuraLLM/Sakura-13B-LNovel-v0.8-4bit) | 🤗 [Sakura-13B-LNovel-v0.8-3bit](https://huggingface.co/SakuraLLM/Sakura-13B-LNovel-v0.8-3bit) |
|
34 |
|
35 |
目前仍为实验版本,翻译质量较差.
|
36 |
|
37 |
~~lsp们最关注的翻译R18轻小说的效果:使用[这本r18小说](https://novel18.syosetu.com/n2975ig)的部分文本,比较各版本输出文本(其中GPT网页端和API均无法翻译),结果已上传至[链接](https://huggingface.co/sakuraumi/Sakura-13B-Galgame-Archived/blob/main/r18_test.txt)~~
|
38 |
|
39 |
+
# 显存需求(尚未完成)
|
40 |
+
|
41 |
+
使用v0.8版本进行测试,模型生成参数与仓库中`generation_config.json`一致,显存占用数据取自`nvidia-smi`
|
42 |
+
|
43 |
+
| 模型量化类型 | 载入显存 | 推理显存(ctx约600) | 推理显存(ctx约1800) |
|
44 |
+
|:-------:|:-------:|:-------:|:-------:|
|
45 |
+
| 全量 | 超出游戏显卡显存范围 | - | - |
|
46 |
+
| 8bit | - | - | - |
|
47 |
+
| 4bit | - | 14.9G | 17.4G |
|
48 |
+
| 3bit | - | - | - |
|
49 |
+
|
50 |
|
51 |
# 日志
|
52 |
|