overload7015 commited on
Commit
8c2917f
·
1 Parent(s): ab122f9

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +7 -6
README.md CHANGED
@@ -7,18 +7,19 @@ tags:
7
  ![banner](https://huggingface.co/overload7015/So-Vits-SukaSuka-Chtholly/resolve/main/logo.jpg)
8
 
9
 
10
- 项目仓库:https://github.com/svc-develop-team/so-vits-svc
11
- 项目来源:末日三问/末日时在做什么?有没有空?可以来拯救吗?/終末なにしてますか?忙しいですか?救ってもらっていいですか?
12
- 来自 **中珂院炼金学分院** Q群:715311859
13
 
14
  ***
15
 
16
- ## 实验目标:
 
17
  70%情况下,在入门级发烧HiFi设备下无法识别出与人类声音的区别(未达成)
18
- ## 实验综述:
19
  2022年5月3日,公布第三代模型,使用SoVits的768训练分支制作,*共计1360epoch、189600step*。
20
  768分支训练方案的优点在于可以生成更加拟合目标声线的音频,但是缺点是训练困难且容易受到杂音干扰,经常会出现高音破音或者糊掉的情况。相比于1.0原版分支,768训练出来的模型不适合作为翻唱模型,反而更适合文本转语音的TTS/Vits→Audio的流程。
21
- ## 实验结论:
22
  因为sovits在效果上只改变了说话人的声线,不改变具体的说话内容,所以推理参数调教得好的话可以适应几乎所有语种,至于TTS目前新出来了一个叫作Bark的具有情感功能的TTS人工智能,相信其在未来,可以为sovits的变声功能锦上添花。
23
 
24
 
 
7
  ![banner](https://huggingface.co/overload7015/So-Vits-SukaSuka-Chtholly/resolve/main/logo.jpg)
8
 
9
 
10
+ > 项目仓库:https://github.com/svc-develop-team/so-vits-svc
11
+ > 项目来源:末日三问/末日时在做什么?有没有空?可以来拯救吗?/終末なにしてますか?忙しいですか?救ってもらっていいですか?
12
+ > 来自 **中珂院炼金学分院** Q群:715311859
13
 
14
  ***
15
 
16
+ # 第三次实验简要记录
17
+ ### 实验目标:
18
  70%情况下,在入门级发烧HiFi设备下无法识别出与人类声音的区别(未达成)
19
+ ### 实验综述:
20
  2022年5月3日,公布第三代模型,使用SoVits的768训练分支制作,*共计1360epoch、189600step*。
21
  768分支训练方案的优点在于可以生成更加拟合目标声线的音频,但是缺点是训练困难且容易受到杂音干扰,经常会出现高音破音或者糊掉的情况。相比于1.0原版分支,768训练出来的模型不适合作为翻唱模型,反而更适合文本转语音的TTS/Vits→Audio的流程。
22
+ ### 实验结论:
23
  因为sovits在效果上只改变了说话人的声线,不改变具体的说话内容,所以推理参数调教得好的话可以适应几乎所有语种,至于TTS目前新出来了一个叫作Bark的具有情感功能的TTS人工智能,相信其在未来,可以为sovits的变声功能锦上添花。
24
 
25