Fish Speech

[English](../README.md) | [简体中文](README.zh.md) | **Portuguese** | [日本語](README.ja.md) | [한국어](README.ko.md)

Este código-fonte e os modelos são publicados sob a licença CC-BY-NC-SA-4.0. Consulte [LICENSE](LICENSE) para mais detalhes. --- ## Funcionalidades 1. **TTS Zero-shot & Few-shot**: Insira uma amostra vocal de 10 a 30 segundos para gerar saída de TTS de alta qualidade. **Para diretrizes detalhadas, veja [Melhores Práticas para Clonagem de Voz](https://docs.fish.audio/text-to-speech/voice-clone-best-practices).** 2. **Suporte Multilíngue e Interlingual**: Basta copiar e colar o texto multilíngue na caixa de entrada—não se preocupe com o idioma. Atualmente suporta inglês, japonês, coreano, chinês, francês, alemão, árabe e espanhol. 3. **Sem Dependência de Fonemas**: O modelo tem forte capacidade de generalização e não depende de fonemas para TTS. Ele pode lidar com textos em qualquer script de idioma. 4. **Alta Precisão**: Alcança uma CER (Taxa de Erro de Caracteres) e WER (Taxa de Erro de Palavras) de cerca de 2% para textos de 5 minutos em inglês. 5. **Rápido**: Com a aceleração fish-tech, o fator de tempo real é de aproximadamente 1:5 em um laptop Nvidia RTX 4060 e 1:15 em uma Nvidia RTX 4090. 6. **Inferência WebUI**: Apresenta uma interface de usuário web baseada em Gradio, fácil de usar e compatível com navegadores como Chrome, Firefox e Edge. 7. **Inferência GUI**: Oferece uma interface gráfica PyQt6 que funciona perfeitamente com o servidor API. Suporta Linux, Windows e macOS. [Veja o GUI](https://github.com/AnyaCoder/fish-speech-gui). 8. **Fácil de Implantar**: Configura facilmente um servidor de inferência com suporte nativo para Linux, Windows e macOS, minimizando a perda de velocidade. ## Isenção de Responsabilidade Não nos responsabilizamos por qualquer uso ilegal do código-fonte. Consulte as leis locais sobre DMCA (Digital Millennium Copyright Act) e outras leis relevantes em sua região. ## Demonstração Online [Fish Audio](https://fish.audio) ## Início Rápido de Inferência Local [inference.ipynb](/inference.ipynb) ## Vídeos #### 1.4 Introdução: https://www.bilibili.com/video/BV1pu46eVEk7 #### 1.2 Introdução: https://www.bilibili.com/video/BV1wz421B71D #### 1.1 Apresentação Técnica: https://www.bilibili.com/video/BV1zJ4m1K7cj ## Documentação - [Inglês](https://speech.fish.audio/) - [Chinês](https://speech.fish.audio/zh/) - [Japonês](https://speech.fish.audio/ja/) - [Português (Brasil)](https://speech.fish.audio/pt/) ## Exemplos - [Inglês](https://speech.fish.audio/samples/) - [Chinês](https://speech.fish.audio/zh/samples/) - [Japonês](https://speech.fish.audio/ja/samples/) - [Português (Brasil)](https://speech.fish.audio/pt/samples/) ## Agradecimentos - [VITS2 (daniilrobnikov)](https://github.com/daniilrobnikov/vits2) - [Bert-VITS2](https://github.com/fishaudio/Bert-VITS2) - [GPT VITS](https://github.com/innnky/gpt-vits) - [MQTTS](https://github.com/b04901014/MQTTS) - [GPT Fast](https://github.com/pytorch-labs/gpt-fast) - [GPT-SoVITS](https://github.com/RVC-Boss/GPT-SoVITS) ## Patrocinadores

Servidores de processamento de dados fornecidos por 6Block

Inferência online do Fish Audio em parceria com a Lepton