File size: 14,691 Bytes
0065413
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
{
    "(1)MDX-Net(onnx_dereverb):对于双通道混响是最好的选择,不能去除单通道混响;": "(1)MDX-Net(onnx_dereverb):對於雙通道混響是最佳選擇,但不能去除單通道混響;",
    "(234)DeEcho:去除延迟效果。Aggressive比Normal去除得更彻底,DeReverb额外去除混响,可去除单声道混响,但是对高频重的板式混响去不干净。": "(234)DeEcho: 去除延遲效果。Aggressive 比 Normal 去除得更徹底,DeReverb 額外去除混響,可去除單聲道混響,但對高頻重的板式混響去不乾淨。",
    "*GPT模型列表": "*GPT模型列表",
    "*SoVITS模型列表": "*SoVITS模型列表",
    "*实验/模型名": "*實驗/模型名",
    "*文本标注文件": "*文本標注文件",
    "*训练集音频文件目录": "*訓練集音頻文件目錄",
    "*请上传并填写参考信息": "*請上傳並填寫參考信息",
    "*请填写需要合成的目标文本和语种模式": "請填寫需要合成的目標文本和語言模式",
    ".list标注文件的路径": ".list標註文件的路徑",
    "0-前置数据集获取工具": "0-前置數據集獲取工具",
    "0a-UVR5人声伴奏分离&去混响去延迟工具": "0a-UVR5人聲伴奏分離&去混響去延遲工具",
    "0b-语音切分工具": "0b-語音切分工具",
    "0bb-语音降噪工具": "0bb-語音降噪工具",
    "0c-中文批量离线ASR工具": "0c-中文批量離線ASR工具",
    "0d-语音文本校对标注工具": "0d-語音文本校對標注工具",
    "1-GPT-SoVITS-TTS": "1-GPT-SoVITS-TTS",
    "1A-训练集格式化工具": "1A-訓練集格式化工具",
    "1Aa-文本内容": "1Aa-文本內容",
    "1Aabc-训练集格式化一键三连": "1Aabc-訓練集格式化一鍵三連",
    "1Ab-SSL自监督特征提取": "1Ab-SSL自監督特徵提取",
    "1Ac-语义token提取": "1Ac-語義token提取",
    "1B-微调训练": "1B-微調訓練",
    "1Ba-SoVITS训练。用于分享的模型文件输出在SoVITS_weights下。": "1Ba-SoVITS訓練。用於分享的模型文件輸出在SoVITS_weights下。",
    "1Bb-GPT训练。用于分享的模型文件输出在GPT_weights下。": "1Bb-GPT訓練。用於分享的模型文件輸出在GPT_weights下。",
    "1C-推理": "1C-推理",
    "1、DeEcho-DeReverb模型的耗时是另外2个DeEcho模型的接近2倍;": "1、DeEcho-DeReverb 模型的處理時間是另外兩個 DeEcho 模型的接近兩倍;",
    "1、保留人声:不带和声的音频选这个,对主人声保留比HP5更好。内置HP2和HP3两个模型,HP3可能轻微漏伴奏但对主人声保留比HP2稍微好一丁点;": "1、保留人聲:不帶和聲的音頻選這個,對主人聲保留比HP5更好。內置HP2和HP3兩個模型,HP3可能輕微漏伴奏但對主人聲保留比HP2稍微好一點點;",
    "2-GPT-SoVITS-变声": "2-GPT-SoVITS-變聲",
    "2、MDX-Net-Dereverb模型挺慢的;": "2、MDX-Net-Dereverb 模型的處理時間挺慢的;",
    "2、仅保留主人声:带和声的音频选这个,对主人声可能有削弱。内置HP5一个模型;": "2、僅保留主人聲:帶和聲的音頻選這個,對主人聲可能有削弱。內置HP5一個模型;",
    "3、个人推荐的最干净的配置是先MDX-Net再DeEcho-Aggressive。": "3、個人推薦的最乾淨的配置是先 MDX-Net 再 DeEcho-Aggressive。",
    "3、去混响、去延迟模型(by FoxJoy):": "3、去混響、去延遲模型(by FoxJoy):",
    "ASR 模型": "ASR 模型",
    "ASR 模型尺寸": "ASR 模型尺寸",
    "数据类型精度": "數據類型精度",
    "ASR 语言设置": "ASR 語言設置",
    "ASR进程输出信息": "ASR進程輸出信息",
    "GPT模型列表": "GPT模型列表",
    "GPT训练进程输出信息": "GPT訓練進程輸出信息",
    "GPU卡号,只能填1个整数": "GPU卡號,只能填1個整數",
    "GPU卡号以-分割,每个卡号一个进程": "GPU卡號以-分割,每個卡號一個進程",
    "SSL进程输出信息": "SSL進程輸出信息",
    "SoVITS模型列表": "SoVITS模型列表",
    "SoVITS训练进程输出信息": "SoVITS訓練進程輸出信息",
    "TTS推理WebUI进程输出信息": "TTS推理WebUI進程輸出信息",
    "TTS推理进程已关闭": "TTS推理進程已關閉",
    "TTS推理进程已开启": "TTS推理進程已開啟",
    "UVR5已关闭": "UVR5已關閉",
    "UVR5已开启": "UVR5已開啟",
    "UVR5进程输出信息": "UVR5進程輸出信息",
    "alpha_mix:混多少比例归一化后音频进来": "alpha_mix:混多少比例歸一化後音頻進來",
    "gpt采样参数(无参考文本时不要太低。不懂就用默认):": "GPT 采样参数(无参考文本时不要太低。不懂就用默认):",
    "hop_size:怎么算音量曲线,越小精度越大计算量越高(不是精度越大效果越好)": "hop_size:怎麼算音量曲線,越小精度越大計算量越高(不是精度越大效果越好)",
    "max:归一化后最大值多少": "max:歸一化後最大值多少",
    "max_sil_kept:切完后静音最多留多长": "max_sil_kept:切完後靜音最多留多長",
    "min_interval:最短切割间隔": "min_interval:最短切割間隔",
    "min_length:每段最小多长,如果第一段太短一直和后面段连起来直到超过这个值": "min_length:每段最小多長,如果第一段太短一直和後面段連起來直到超過這個值",
    "temperature": "temperature",
    "threshold:音量小于这个值视作静音的备选切割点": "threshold:音量小於這個值視作靜音的備選切割點",
    "top_k": "top_k",
    "top_p": "top_p",
    "一键三连进程输出信息": "一鍵三連進程輸出信息",
    "不切": "不切",
    "中文": "中文",
    "中文教程文档:https://www.yuque.com/baicaigongchang1145haoyuangong/ib3g1e": "中文教程文檔:https://www.yuque.com/baicaigongchang1145haoyuangong/ib3g1e",
    "中英混合": "中英混合",
    "也可批量输入音频文件, 二选一, 优先读文件夹": "也可批量输入音频文件, 二选一, 优先读文件夹",
    "人声伴奏分离批量处理, 使用UVR5模型。": "人聲伴奏分離批量處理, 使用UVR5模型。",
    "人声提取激进程度": "人聲提取激進程度",
    "伴奏人声分离&去混响&去回声": "伴奏人聲分離&去混響&去回聲",
    "使用无参考文本模式时建议使用微调的GPT,听不清参考音频说的啥(不晓得写啥)可以开,开启后无视填写的参考文本。": "使用無參考文本模式時建議使用微調的GPT,聽不清參考音頻說的是啥(不知道寫啥)可以開啟,開啟後無視填寫的參考文本。",
    "保存频率save_every_epoch": "保存頻率save_every_epoch",
    "凑50字一切": "湊50字一切",
    "凑四句一切": "湊四句一切",
    "切分后文本": "切分後文本",
    "切分后的子音频的输出根目录": "切分後的子音頻的輸出根目錄",
    "切割使用的进程数": "切割使用的進程數",
    "刷新模型路径": "刷新模型路徑",
    "前端处理后的文本(每句):": "前端處理後的文本(每句):",
    "去混响/去延迟,附:": "去混響/去延遲,附",
    "参考音频在3~10秒范围外,请更换!": "參考音頻在3~10秒範圍外,請更換!",
    "参考音频的文本": "參考音頻的文本",
    "参考音频的语种": "參考音頻的語種",
    "合成语音": "合成語音",
    "合格的文件夹路径格式举例: E:\\codes\\py39\\vits_vc_gpu\\白鹭霜华测试样例(去文件管理器地址栏拷就行了)。": "合格的文件夾路徑格式舉例: E:\\codes\\py39\\vits_vc_gpu\\白鷺霜華測試樣例(去文件管理器地址欄拷就行了)。",
    "后续将支持转音素、手工修改音素、语音合成分步执行。": "後續將支持轉音素、手工修改音素、語音合成分步執行。",
    "填切割后音频所在目录!读取的音频文件完整路径=该目录-拼接-list文件里波形对应的文件名(不是全路径)。如果留空则使用.list文件里的绝对全路径。": "填切割後音頻所在目錄!讀取的音頻文件完整路徑=該目錄-拼接-list文件裡波形對應的文件名(不是全路徑)。如果留空則使用.list文件裡的絕對全路徑。",
    "多语种混合": "多語種混合",
    "实际输入的参考文本:": "實際輸入的參考文本:",
    "实际输入的目标文本(切句后):": "實際輸入的目標文本(切句後):",
    "实际输入的目标文本(每句):": "實際輸入的目標文本(每句):",
    "实际输入的目标文本:": "實際輸入的目標文本:",
    "导出文件格式": "導出檔格式",
    "开启GPT训练": "開啟GPT訓練",
    "开启SSL提取": "開啟SSL提取",
    "开启SoVITS训练": "開啟SoVITS訓練",
    "开启一键三连": "開啟一鍵三連",
    "开启文本获取": "開啟文本獲取",
    "开启无参考文本模式。不填参考文本亦相当于开启。": "開啟無參考文本模式。不填參考文本亦相當於開啟。",
    "开启离线批量ASR": "開啟離線批量ASR",
    "开启语义token提取": "開啟語義token提取",
    "开启语音切割": "開啟語音切割",
    "开启语音降噪": "開啟語音降噪",
    "怎么切": "怎麼切",
    "总训练轮数total_epoch": "總訓練輪數total_epoch",
    "总训练轮数total_epoch,不建议太高": "總訓練輪數total_epoch,不建議太高",
    "打标工具WebUI已关闭": "打標工具WebUI已關閉",
    "打标工具WebUI已开启": "打標工具WebUI已開啟",
    "打标工具进程输出信息": "打標工具進程輸出信息",
    "指定输出主人声文件夹": "指定输出主人声文件夹",
    "指定输出非主人声文件夹": "指定输出非主人声文件夹",
    "按中文句号。切": "按中文句號。切",
    "按标点符号切": "按標點符號切",
    "按英文句号.切": "按英文句號.切",
    "文本切分工具。太长的文本合成出来效果不一定好,所以太长建议先切。合成会根据文本的换行分开合成再拼起来。": "文本切分工具。太長的文本合成出來效果不一定好,所以太長建議先切。合成會根據文本的換行分開合成再拼起來。",
    "文本模块学习率权重": "文本模塊學習率權重",
    "文本进程输出信息": "文本進程輸出信息",
    "施工中,请静候佳音": "施工中,請靜候佳音",
    "日文": "日文",
    "日英混合": "日英混合",
    "是否仅保存最新的ckpt文件以节省硬盘空间": "是否僅保存最新的ckpt文件以節省硬碟空間",
    "是否在每次保存时间点将最终小模型保存至weights文件夹": "是否在每次保存時間點將最終小模型保存至weights文件夾",
    "是否开启TTS推理WebUI": "是否開啟TTS推理WebUI",
    "是否开启UVR5-WebUI": "是否開啟UVR5-WebUI",
    "是否开启dpo训练选项(实验性)": "是否開啟dpo訓練選項(實驗性)",
    "是否开启打标WebUI": "是否開啟打標WebUI",
    "是否直接对上次合成结果调整语速。防止随机性。": "是否直接對上次合成結果調整語速。防止隨機性。",
    "显卡信息": "顯卡信息",
    "本软件以MIT协议开源, 作者不对软件具备任何控制力, 使用软件者、传播软件导出的声音者自负全责. <br>如不认可该条款, 则不能使用或引用软件包内任何代码和文件. 详见根目录<b>LICENSE</b>.": "本軟件以MIT協議開源, 作者不對軟件具備任何控制力, 使用軟件者、傳播軟件導出的聲音者自負全責. <br>如不認可該條款, 則不能使用或引用軟件包內任何代碼和文件. 詳見根目錄<b>LICENSE</b>.",
    "模型": "模型",
    "模型分为三类:": "模型分為三類:",
    "模型切换": "模型切換",
    "每张显卡的batch_size": "每張顯卡的batch_size",
    "终止ASR进程": "終止ASR進程",
    "终止GPT训练": "終止GPT訓練",
    "终止SSL提取进程": "終止SSL提取進程",
    "终止SoVITS训练": "終止SoVITS訓練",
    "终止一键三连": "終止一鍵三連",
    "终止文本获取进程": "終止文本獲取進程",
    "终止语义token提取进程": "終止語義token提取進程",
    "终止语音切割": "終止語音切割",
    "终止语音降噪进程": "終止語音降噪進程",
    "英文": "英文",
    "语义token提取进程输出信息": "語義token提取進程輸出信息",
    "语速": "語速",
    "语速调整,高为更快": "調整語速,高為更快",
    "语音切割进程输出信息": "語音切割進程輸出信息",
    "语音降噪进程输出信息": "語音降噪進程輸出信息",
    "请上传3~10秒内参考音频,超过会报错!": "請上傳3~10秒內參考音頻,超過會報錯!",
    "请输入有效文本": "請輸入有效文本",
    "转换": "轉換",
    "输入待处理音频文件夹路径": "輸入待處理音頻資料夾路徑",
    "输入文件夹路径": "輸入文件夾路徑",
    "输出logs/实验名目录下应有23456开头的文件和文件夹": "輸出logs/實驗名目錄下應有23456開頭的文件和文件夾",
    "输出信息": "輸出訊息",
    "输出文件夹路径": "輸出文件夾路徑",
    "输出的语音": "輸出的語音",
    "选择训练完存放在SoVITS_weights和GPT_weights下的模型。默认的一个是底模,体验5秒Zero Shot TTS用。": "選擇訓練完存放在SoVITS_weights和GPT_weights下的模型。默認的一個是底模,體驗5秒Zero Shot TTS用。",
    "降噪结果输出文件夹": "降噪結果輸出文件夾",
    "降噪音频文件输入文件夹": "降噪音頻文件輸入文件夾",
    "需要合成的切分前文本": "需要合成的切分前文本",
    "需要合成的文本": "需要合成的文本",
    "需要合成的语种": "需要合成的語種",
    "音频自动切分输入路径,可文件可文件夹": "音頻自動切分輸入路徑,可文件可文件夾",
    "预训练的GPT模型路径": "預訓練的GPT模型路徑",
    "预训练的SSL模型路径": "預訓練的SSL模型路徑",
    "预训练的SoVITS-D模型路径": "預訓練的SoVITS-D模型路徑",
    "预训练的SoVITS-G模型路径": "預訓練的SoVITS-G模型路徑",
    "预训练的中文BERT模型路径": "預訓練的中文BERT模型路徑"
}