---
license: mit
datasets:
- ThePioneer/Ver0_voice_dataset
language:
- en
- ja
- zh
tags:
- music
- voice
---

アニメ声のようなわざとらしい声でもなく、ボカロなどのソフトを使ったいかにも合成の音声でもなく、クラスに一人くらいいそうな、自然で親しみやすい美少女の声を…。

本モデルは、そういうコンセプトで開発された[So-vits-svc 4.0](https://github.com/svc-develop-team/so-vits-svc)のモデルです。

一次音声は私自身の肉声から合成し、その素材をElevenLabsで1時間程度まで水増しし、[水増しした音声データセット](https://huggingface.co/datasets/ThePioneer/Ver0_voice_dataset)を学習させました。

innnky氏がG_0.pth、D_0.pthのあったrepoを削除してしまったようなので、学習用のベースとなった[G_0.pth](https://huggingface.co/ThePioneer/NaturalGirlyVoice/blob/main/G_0.pth)、[D_0.pth](https://huggingface.co/ThePioneer/NaturalGirlyVoice/blob/main/D_0.pth)および[hubertのチェックポイント](https://huggingface.co/ThePioneer/NaturalGirlyVoice/blob/main/checkpoint_best_legacy_500.pt)も同梱しています。

また、推論や学習ができるように、[notebook](https://huggingface.co/ThePioneer/NaturalGirlyVoice/blob/main/sovits4_0_for_training_and_inference.ipynb)も同梱しています（利用時はconfig.jsonを置き換えることも必要です）。

## 注意
 - Sovitsの仕様で、音声の直前の無音部でノイズが発生することがあります。
 - 中国由来のモデルなので、日本語や英語の発音はたまにおかしくなります。
 - 自然な音声を目指したので、（もしかすると）実在人物の音声に類似している可能性があります。「歌わせてみた」など、平和的な内容での利用を推奨します。
   - （おそらく日本では）違法ではないですが、例えばどこかの4chan民のように『我が闘争』を読ませる使い方や、nsfw音声としての利用は推奨されません。

## サンプル
God knows...
<audio src="https://huggingface.co/ThePioneer/NaturalGirlyVoice/resolve/main/God-knows...-sovits4-ver0.mp3" controls></audio>