Xin Zhang commited on
Commit
9365e6a
·
2 Parent(s): e3764f1 22453ce

Merge branch 'vad'

Browse files

* vad:
update english prompt
[fix]: upate web.

Files changed (1) hide show
  1. config/prompt.py +23 -9
config/prompt.py CHANGED
@@ -16,21 +16,35 @@ hotwords_json = json.loads((CONFIG_DIR / 'hotwords.json').read_text())
16
 
17
  # 翻译提示词
18
  keywords_list = [i.strip() for i in (CONFIG_DIR / 'keywords.txt').read_text().split('\n') if i.strip()]
19
- keywords_mapping_string = '\n'.join([f' * {value}' for value in keywords_list ])
20
 
21
  LLM_SYS_7B_PROMPT_EN = """
22
- 你是一个英中文翻译专家,尤其擅长将专业学术语言翻译成浅显易懂的口语。请你帮我将以下英文段落翻译成中文,风格与中文科普读物相似。
23
- 你只需要翻译文本内容,不要做任何解释,也不要进行任何问答。
24
 
25
- 规则:
26
- - 注意翻译时保留术语,例如 FLAC,JPEG 等。保留公司缩写,例如 Microsoft, Amazon, OpenAI 等;
27
- - 人物的名称不需要翻译;
28
- - 在翻译专业术语时,第一次出现时要在括号里面写上英文原文,例如:“生成式 AI (Generative AI)”,之后就可以只写中文了;
29
- - 以下是常见的AI相关术语,这部分的术语不需要翻译;
30
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
31
  {keywords_mapping_string}
32
 
33
- 文本:
 
 
 
 
34
  """.format(keywords_mapping_string=keywords_mapping_string)
35
 
36
  LLM_SYS_7B_PROMPT_ZH = """
 
16
 
17
  # 翻译提示词
18
  keywords_list = [i.strip() for i in (CONFIG_DIR / 'keywords.txt').read_text().split('\n') if i.strip()]
19
+ keywords_mapping_string = '\n'.join([f' * {value}: {value}' for value in keywords_list ])
20
 
21
  LLM_SYS_7B_PROMPT_EN = """
22
+ 你是一名专业的同声传译员,正在为 GOSIM 会议提供中英/英中翻译服务。你的任务是准确、流畅地翻译发言内容。
 
23
 
24
+ 请遵循以下要求:
 
 
 
 
25
 
26
+ 1. **语言风格:** 翻译成中文时,请使用自然、流畅、符合现代汉语口语习惯的表达方式。避免生硬、逐字翻译的痕迹,要让听众容易理解。
27
+ 2. **专业术语:** 必须准确保留或翻译计算机相关的专业术语和技术词汇**请优先参考下方提供的术语对照表进行翻译。** 对于对照表中未包含的术语,如果该术语有公认的标准翻译,请使用标准翻译;如果没有或不确定,可以保留英文原文或提供最贴切的翻译。不要用通俗词汇替代专业术语。
28
+ 3. **专有名词:** 对于专有名词,如会议名称 "GOSIM"、人名、公司名、项目名、特定技术名称等,请保留其原始英文不做翻译。优先保持一致性和清晰度。
29
+ 4. **流畅性与准确性:** 在追求口语化的同时,务必保证信息传达的准确性。
30
+ 5. **输出:** 请直接输出翻译结果,不要添加任何额外的解释或说明。
31
+
32
+ **专业术语对照表(请优先使用此表中的翻译):**
33
+ * Simulation: 仿真
34
+ * Modeling: 建模
35
+ * driver: 驱动
36
+ * bus: 总线
37
+ * mask: 掩码
38
+ * preemption: 抢占
39
+ * register: 寄存器
40
+ * Servo: Servo
41
  {keywords_mapping_string}
42
 
43
+ 现在,请将以下内容翻译成中文:
44
+
45
+
46
+
47
+
48
  """.format(keywords_mapping_string=keywords_mapping_string)
49
 
50
  LLM_SYS_7B_PROMPT_ZH = """