sakuraumi commited on
Commit
902f600
·
1 Parent(s): 732fffc

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +79 -0
README.md CHANGED
@@ -1,3 +1,82 @@
1
  ---
2
  license: apache-2.0
 
 
 
 
3
  ---
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
  ---
2
  license: apache-2.0
3
+ language:
4
+ - zh
5
+ - ja
6
+ pipeline_tag: text-generation
7
  ---
8
+
9
+ # Sakura-13B-Galgame
10
+
11
+ # 介绍
12
+
13
+ 基于LLaMA2-13B和OpenBuddy构建,在Galgame中日文本数据上进行微调.
14
+
15
+ # 模型详情
16
+
17
+ ## 描述
18
+
19
+ - Finetuned by [SakuraUmi](https://github.com/pipixia244)
20
+ - Finetuned on [openbuddy-llama2-13b](https://huggingface.co/OpenBuddy/openbuddy-llama2-13b-v8.1-fp16)
21
+ - Base model: [Llama2-13B](https://huggingface.co/meta-llama/Llama-2-13b-chat-hf)
22
+ - Languages: Chinese/Japanese
23
+
24
+ ## 基本参数
25
+
26
+ 数据集:约260k Galgame中日文本
27
+
28
+ 微调epoch数:2
29
+
30
+ 参数量:13B
31
+
32
+ ## 效果
33
+
34
+ | 日文原文 | 中文翻译 |
35
+ | ---- | ---- |
36
+ | 「女の子の一人暮らしって、やっぱ一階は防范的に危ないのかな~? お父さんには、一階はやめとけ~って言われててね?」 | 「一个女孩子住在一楼,还是有点不太安全吧?爸爸说让我不要住在一楼」 |
37
+ | 「助けて、誰か助けてって思いながら、ただただ泣いてたんです……」 | 「我一边祈祷着,祈祷着有人能来救救我们,一边不停地哭泣……」|
38
+ | 「そうだよ。これが太一の普通の顔だって。でも、ちょっと不気味だから、わたしみたいにニッコリ笑ってみて?」 | 「是啊。这就是太一的普通表情。但是,因为有点吓人,所以你也试着像我一样微笑一下吧?」 |
39
+ | 「そういうヒトの感情は、発情期を迎えてもいないネコには難しい」 | 「这种人类的感情,对还没有迎来发情期的猫来说太难懂了」 |
40
+ | 「朝になって、病院に行くまで。ずっと、ずーっとそばに居てくれて……」 | 「一直陪我到早上去医院。一直,一直陪在我身边……」 |
41
+ | 「それ以外は、自由に過ごしているため、各自が好きにできる、とても平和な部活だった……。」 | 「除此之外,社团活动都是自由参加的,每个人都可以按自己的意愿去做自己想做的事情,所以社团活动也是非常和平的……」 |
42
+ | 「そーだそーだ。せっかくお店休みにして遊びに来たのに」 | 「是啊是啊,难得休息一天,我还想出来玩一下呢」|
43
+ | この世界に生まれた存在という束縛からさえ解放された | 甚至从生于这个世界这个束缚中得到了解放 |
44
+
45
+ # 推理
46
+
47
+ - Galgame翻译的prompt构建:
48
+
49
+ ```python
50
+ input_text = "" # 用户输入
51
+ query = "将下面的日文文本翻译成中文:" + input_text
52
+ prompt = "Human: \n" + query + "\n\nAssistant: \n"
53
+ ```
54
+
55
+ - 推理参数:
56
+
57
+ | 参数 | 值 |
58
+ | ---- | ---- |
59
+ | beams number | 2 |
60
+ | repetition penalty | 1 |
61
+ | max new token | 512 |
62
+ | min new token | 1 |
63
+
64
+ 其余推理流程与LLaMA2一致
65
+
66
+ # 微调
67
+
68
+ 流程与LLaMA2一致,prompt构造参考推理部分
69
+
70
+ # 后续工作
71
+
72
+ 1. 优化数据集,包括提高数据集质量和增加数据数量
73
+ 2. 支持上下文理解
74
+ 3. 支持指定专有名词
75
+
76
+ # Copyright Notice
77
+
78
+ This model is built upon Meta's LLaMA series of models and is subject to Meta's licensing agreement.
79
+
80
+ This model is intended for use only by individuals who have obtained approval from Meta and are eligible to download LLaMA.
81
+
82
+ If you have not obtained approval from Meta, you must visit the https://ai.meta.com/llama/ page, read and agree to the model's licensing agreement, submit an application, and wait for approval from Meta before downloading the model from this page.