poderia compartilhar o .safetensor e o vocab.txt tb? seria de bastante ajuda :)
poderia compartilhar o .safetensor e o vocab.txt tb? seria de bastante ajuda :)
poderia compartilhar o .safetensor e o vocab.txt tb? seria de bastante ajuda :)
irmão o safetensor você precisa converter diretamente na interface de finetune este e o modelo full e o vocab.txt e padrão do repo F5-TTS o so fazer fine tune e sai para o abraço fiquei tão feliz de encontrar este repositorio depois de ver ele falando no git ja fiz o finetune e ficou perfect
eu testei com o full so que nao ficou com sotaque brasileiro ficou sotaque de gringo
eu testei com o full so que nao ficou com sotaque brasileiro ficou sotaque de gringo
eu particulamente não testei o modelo diretamente utilizei para finetune para adiantar o trabalho mais uma dica você tem que usar o audio de referencia em portugues e tem que ter o texto de referencia igual o que esta no audio diferente de outros modelos que pega somente o pitch este parece pegar tudo exmplo -ref_text "levantara a mão contra ele e o oficial então arrancara da espada e atravessara o de lado a lado estava direito ah" \ aqui tem que ser a mesma coisa que seu audio de referente esta dizendo
"""python inference-cli.py \
Specify the model name to use for inference
--model "F5-TTS" \
Path to the model checkpoint file, which contains the saved model weights
--ckpt_file "path/to/model.pt" \
Path to the reference audio file. This file is used to capture the speaking style
and voice characteristics, which the model will try to mimic.
--ref_audio "wavs/sample_audio.wav" \
Reference text associated with the reference audio file.
This helps the model understand the speaking style.
--ref_text "levantara a mão contra ele e o oficial então arrancara da espada e atravessara o de lado a lado estava direito ah" \
Text that the model will generate speech for. This will be spoken in the style
derived from the reference audio and text.
--gen_text "O Brasil, oficialmente República Federativa do Brasil, é o maior país da América do Sul e da América Latina.""""
eu consegui um sotaque aceitavel ,mas o TTs instavel ele alucina de vez em quando