Spaces:

pineconeT94
/

fishspeech2

No application file

File size: 2,414 Bytes

8b14bed

# Iniciar Agente

!!! note
    Todo o documento foi traduzido por claude3.5 Sonnet, se você for um falante nativo e achar a tradução problemática, muito obrigado por nos enviar um problema ou uma solicitação pull!

## Requisitos

- Memória GPU: No mínimo 8GB (com quantização), 16GB ou mais é recomendado.
- Uso de disco: 10GB

## Download do Modelo

Você pode obter o modelo através de:

```bash
huggingface-cli download fishaudio/fish-agent-v0.1-3b --local-dir checkpoints/fish-agent-v0.1-3b
```

Coloque-os na pasta 'checkpoints'.

Você também precisará do modelo fish-speech que pode ser baixado seguindo as instruções em [inference](inference.md).

Então haverá 2 pastas em checkpoints.

O `checkpoints/fish-speech-1.4` e `checkpoints/fish-agent-v0.1-3b`

## Preparação do Ambiente

Se você já tem o Fish-speech, pode usar diretamente adicionando a seguinte instrução:
```bash
pip install cachetools
```

!!! nota
    Por favor, use a versão Python abaixo de 3.12 para compilação.

Se você não tem, use os comandos abaixo para construir seu ambiente:

```bash
sudo apt-get install portaudio19-dev

pip install -e .[stable]
```

## Iniciar a Demo do Agente

Para construir o fish-agent, use o comando abaixo na pasta principal:

```bash
python -m tools.api --llama-checkpoint-path checkpoints/fish-agent-v0.1-3b/ --mode agent --compile
```

O argumento `--compile` só suporta Python < 3.12, o que aumentará muito a velocidade de geração de tokens.

Não será compilado de uma vez (lembre-se).

Então abra outro terminal e use o comando:

```bash
python -m tools.e2e_webui
```

Isso criará uma WebUI Gradio no dispositivo.

Quando você usar o modelo pela primeira vez, ele irá compilar (se `--compile` estiver True) por um curto período, então aguarde com paciência.

## Gradio Webui
<p align="center">
   <img src="../../assets/figs/agent_gradio.png" width="75%">
</p>

Divirta-se!

## Desempenho

Em nossos testes, um laptop com 4060 mal consegue rodar, ficando muito sobrecarregado, gerando apenas cerca de 8 tokens/s. A 4090 gera cerca de 95 tokens/s com compilação, que é o que recomendamos.

# Sobre o Agente

A demo é uma versão alpha inicial de teste, a velocidade de inferência precisa ser otimizada, e há muitos bugs aguardando correção. Se você encontrou um bug ou quer corrigi-lo, ficaremos muito felizes em receber uma issue ou um pull request.