Spaces:

14-26AA
/

sovits_aishell3

Build error

App Files Files Community

14-26AA commited on Oct 5, 2022

Commit

2c29a49

1 Parent(s): c8ceb0d

Update app.py

Browse files

Files changed (1) hide show

app.py +2 -1

app.py CHANGED Viewed

@@ -15,7 +15,7 @@ with app:
             模型对于通常的说话语音转换效果良好，唱歌的话需要在目标说话人音域范围内才能有较好效果。由于aishell3数据占比过大，训练epoch不足，opencpop说话人的高音部分质量不佳。\n
             模型中各说话人的适宜中心音域分别为：\n
             aishell3(0-173号) 女性说话：A3,男性说话：C3\n
-            opencpop(174号)   女性唱歌：C4（超过C5基本失真）\n
             如果转换通常说话音频，需要参考上面范围调key至目标说话人中心音域附近(如男性说话转为女性说话，key=8，反过来为-8)\n
             如果源音频为部分虚拟主播音频，通常音调会高于正常女性说话范围，可达到F4-A4左右，请适当降调\n
             对于说话人的详细信息(如性别、年龄等)，可以在文件目录的spkdic_new.json中查看\n
@@ -24,6 +24,7 @@ with app:
             1.音域范围是否合适，可参考上文调整调key的参数，或更换说话人进行尝试\n
             2.源音频是否存在杂音/bgm，请尽量使用干净的音源进行合成，录音时保持室内安静\n
             3.源音频是否存在混响。较强的混响会显著干扰合成效果，导致ai念错字/音调识别错误等\n
             """)
             sid = gr.Dropdown(label="说话人",choices=spkdict, value='speaker0')
             vc_audio = gr.Audio(label="上传音频,建议小于2分钟")

             模型对于通常的说话语音转换效果良好，唱歌的话需要在目标说话人音域范围内才能有较好效果。由于aishell3数据占比过大，训练epoch不足，opencpop说话人的高音部分质量不佳。\n
             模型中各说话人的适宜中心音域分别为：\n
             aishell3(0-173号) 女性说话：A3,男性说话：C3\n
+            opencpop(174号)   女性唱歌：C4-G4（超过C5基本失真）\n
             如果转换通常说话音频，需要参考上面范围调key至目标说话人中心音域附近(如男性说话转为女性说话，key=8，反过来为-8)\n
             如果源音频为部分虚拟主播音频，通常音调会高于正常女性说话范围，可达到F4-A4左右，请适当降调\n
             对于说话人的详细信息(如性别、年龄等)，可以在文件目录的spkdic_new.json中查看\n
             1.音域范围是否合适，可参考上文调整调key的参数，或更换说话人进行尝试\n
             2.源音频是否存在杂音/bgm，请尽量使用干净的音源进行合成，录音时保持室内安静\n
             3.源音频是否存在混响。较强的混响会显著干扰合成效果，导致ai念错字/音调识别错误等\n
+            4.再合成一次试试，每次合成会有部分随机性因素参与，微小的声调问题可能重新合成一次就不存在了。
             """)
             sid = gr.Dropdown(label="说话人",choices=spkdict, value='speaker0')
             vc_audio = gr.Audio(label="上传音频,建议小于2分钟")