Spaces:

RafaG
/

TTS-Rapido

Running

App Files Files Community

RafaG commited on Feb 20, 2024

Commit

14a0306

verified ·

1 Parent(s): b3acc96

Update app.py

Browse files

Files changed (1) hide show

app.py +116 -42

app.py CHANGED Viewed

@@ -12,11 +12,13 @@ subprocess.run(comando_elevenlabs)
 # Executando o comando para instalar ou atualizar o pacote edge-tts
 subprocess.run(comando_edge_tts)
 import subprocess
 import os
 import gradio as gr
 from pydub import AudioSegment
 from voice_map import SUPPORTED_VOICES
 from pydub.silence import split_on_silence
 def generate_audio(texto, modelo_de_voz, velocidade):
@@ -77,17 +79,21 @@ def controlador_generate_audio(audio_input, voice_model_input, speed_input, chec
         print("Erro ao gerar áudio.")
     return audio_file  # Retornar o caminho do arquivo de áudio
-from elevenlabs import generate
-def generate_audio_elevenlabsfree(texto, modelo_de_voz):
     output_dir = "output"
     os.makedirs(output_dir, exist_ok=True)  # Certifique-se de que o diretório de saída exista
     try:
         # Gerar áudio usando elevenlabs
         audio = generate(
             text=texto,
-            voice=modelo_de_voz,
             model='eleven_multilingual_v2'
         )
@@ -103,35 +109,77 @@ def generate_audio_elevenlabsfree(texto, modelo_de_voz):
     except Exception as e:
         print("Erro ao gerar áudio:", e)
         return None
-badges = """
-<div style="display: flex">
-<span style="margin-right: 5px">
-[ ![GitHub](https://img.shields.io/badge/github-%23121011.svg?style=for-the-badge&logo=github&logoColor=white) ](https://github.com/rafaelGodoyEbert)
-</span>
-<span style="margin-right: 5px">
-[ ![Twitter](https://img.shields.io/badge/Twitter-%231DA1F2.svg?style=for-the-badge&logo=Twitter&logoColor=white) ](https://twitter.com/GodoyEbert)
-</span>
-<span>
-[ ![](https://dcbadge.vercel.app/api/server/aihubbrasil) ](https://discord.gg/aihubbrasil)
-</span>
-</div>
-"""
-description = """
-# TTS Rápido
- TTS Rápido, para todos aqueles que sempre me pediam alguma forma de fazer algum TTS.<br>
- Tem em diversos idiomas, só aproveitar<br>
- Increva-se no canal do <a href='https://www.youtube.com/@aihubbrasil' target='_blank'>Youtube do AI HUB Brasil</a> e no meu pessoal <a href='https://www.youtube.com/@godoyy' target='_blank'>Godoyy</a>
-"""
 with gr.Blocks(theme=gr.themes.Default(primary_hue="green", secondary_hue="blue"), title="TTS Rápido") as iface:
     gr.Markdown(badges)
     gr.Markdown(description)
@@ -154,17 +202,43 @@ with gr.Blocks(theme=gr.themes.Default(primary_hue="green", secondary_hue="blue"
             clear_button = gr.ClearButton(audio_input, value='Limpar')
             gr.Markdown("Agradecimentos a rany2 pelo Edge-TTS")
-        with gr.TabItem("Elevenlabs SEM API"):
-            gr.Markdown("Esse é a API gratuita que é disponivel pela própria Elevenlabs, não sei os limites, mas sei que tem, acredito que após 3 requests seguidos já caia, então tenha certeza o texto que vá usar.")
-            audio_input = gr.Textbox(label="Texto (Acho que o limite é 250 caracteres)", value='Texto de exemplo!', interactive=True)
-            voice_model_input = gr.Dropdown(['Arnold', 'Antoni','Bella', 'Rachel', 'Drew', 'Clyde', 'Paul' ], label="Modelo de Voz", value="Arnold")
-            gr.Markdown("Se estiver usando huggingface e não rodar, vá em logs, que está acima da imagem do github e veja se já não passou o limite de request da API")
-            audio_output = gr.Audio(label="Resultado", type="filepath", interactive=False)
-            elevenlabs_button = gr.Button(value="Falar")
-            elevenlabs_button.click(fn=generate_audio_elevenlabsfree, inputs=[audio_input, voice_model_input], outputs=[audio_output])
-            clear_button = gr.ClearButton(audio_input, value='Limpar')
-            gr.Markdown("Agradecimentos ao Elevenlabs")
             # Executar o aplicativo Gradio
         gr.Markdown("""
                     Desenvolvido por Rafael Godoy <br>

 # Executando o comando para instalar ou atualizar o pacote edge-tts
 subprocess.run(comando_edge_tts)
 import subprocess
 import os
 import gradio as gr
 from pydub import AudioSegment
 from voice_map import SUPPORTED_VOICES
+from header import badges, description
 from pydub.silence import split_on_silence
 def generate_audio(texto, modelo_de_voz, velocidade):
         print("Erro ao gerar áudio.")
     return audio_file  # Retornar o caminho do arquivo de áudio
+from elevenlabs import voices, generate
+import requests
+def generate_audio_elevenlabsfree(texto, voice_name):
     output_dir = "output"
     os.makedirs(output_dir, exist_ok=True)  # Certifique-se de que o diretório de saída exista
     try:
+        # Pegar o nome abreviado do modelo de voz
+        modelo_abreviado = voice_name
         # Gerar áudio usando elevenlabs
         audio = generate(
             text=texto,
+            voice=modelo_abreviado,
             model='eleven_multilingual_v2'
         )
     except Exception as e:
         print("Erro ao gerar áudio:", e)
         return None
+def elevenlabsAPI(audio_input_elevenlabs_api, voice_model_input,model_elevenlabs_t, stability_elevenlabs, similarity_boost_elevenlabs, style_elevenlabs, use_speaker_boost_elevenlabs, id_voz_input, id_api, output_dir="output"):
+    try:
+        if not id_api.strip():
+            print("API não fornecida.")
+            return None
+        id_api_value = id_api
+        modelos= model_elevenlabs_t
+        if id_voz_input.strip():  # Se um ID de voz foi fornecido
+            voice_id = id_voz_input
+            print(voice_id)
+            url = f"https://api.elevenlabs.io/v1/text-to-speech/{voice_id}"
+            headers = {
+                "Accept": "audio/mpeg",
+                "Content-Type": "application/json",
+                "xi-api-key": id_api
+            }
+            print(modelos)
+            print(stability_elevenlabs)
+            print(similarity_boost_elevenlabs)
+            print(style_elevenlabs)
+            print(use_speaker_boost_elevenlabs)
+            data = {
+                "text": audio_input_elevenlabs_api,
+                "model_id": modelos,
+                "voice_settings": {
+                    "stability": stability_elevenlabs,
+                    "similarity_boost": similarity_boost_elevenlabs,
+                    "style": style_elevenlabs,
+                    "use_speaker_boost": use_speaker_boost_elevenlabs,
+                }
+            }
+            print(data)
+            response = requests.post(url, headers=headers, json=data)
+            if response.status_code == 200:
+                audio = response.content
+            else:
+                print("Erro ao gerar áudio:", response.text)
+                return None
+        else:  # Se nenhum ID de voz foi fornecido, usar o modelo de voz fornecido
+            print(modelos)
+            print(stability_elevenlabs)
+            print(similarity_boost_elevenlabs)
+            print(style_elevenlabs)
+            print(use_speaker_boost_elevenlabs)
+            audio = generate(
+                text=audio_input_elevenlabs_api,
+                voice=voice_model_input,
+                # voice=Voice(
+                #     voice_id='EXAVITQu4vr4xnSDxMaL',
+                #     name=voice_model_input,
+                #     settings=VoiceSettings(stability=stability_elevenlabs, similarity_boost=similarity_boost_elevenlabs, style=style_elevenlabs, use_speaker_boost=use_speaker_boost_elevenlabs)
+                # ),
+                model=modelos,
+                api_key=id_api
+            )
+        if audio:
+            output_file_path = os.path.join(output_dir, "new_audio.wav")
+            with open(output_file_path, 'wb') as wf:
+                wf.write(audio)
+            print("Áudio gerado com sucesso em:", output_file_path)
+            return output_file_path
+    except Exception as e:
+        print("Erro ao gerar áudio:", e)
+        return None
+all_voices = voices()
 with gr.Blocks(theme=gr.themes.Default(primary_hue="green", secondary_hue="blue"), title="TTS Rápido") as iface:
     gr.Markdown(badges)
     gr.Markdown(description)
             clear_button = gr.ClearButton(audio_input, value='Limpar')
             gr.Markdown("Agradecimentos a rany2 pelo Edge-TTS")
+        with gr.TabItem("Elevenlabs"):
+            with gr.TabItem("Elevenlabs Free"):
+                gr.Markdown("Esse é a API gratuita que é disponivel pela própria Elevenlabs, não sei os limites, mas sei que tem, acredito que após 3 requests seguidos já caia, então tenha certeza o texto que vá usar.")
+                audio_input = gr.Textbox(label="Texto (Não botei limite de caracteres, mas não sei se tem limite no request)", value='Texto de exemplo!', interactive=True)
+                voice_model_input = gr.Dropdown([ voice.name for voice in all_voices], label="Modelo de Voz", value='Adam', interactive=True)
+                gr.Markdown("Se estiver usando huggingface e não rodar, vá em logs, que está acima da imagem do github e veja se já não passou o limite de request da API")
+                audio_output = gr.Audio(label="Resultado", type="filepath", interactive=False)
+                elevenlabs_button = gr.Button(value="Falar")
+                elevenlabs_button.click(fn=generate_audio_elevenlabsfree, inputs=[audio_input, voice_model_input], outputs=[audio_output])
+                clear_button = gr.ClearButton(audio_input, value='Limpar')
+                gr.Markdown("Agradecimentos ao Elevenlabs")
+            with gr.TabItem("Elevenlabs com API"):
+                gr.Markdown("Versão com API, basicamente mesma coisa que o site, mas por algum motivo as pessoas me pediram")
+                audio_input_elevenlabs_api = gr.Textbox(label="Texto (Acho que o limite é 2500 caracteres)", value='Texto de exemplo!', interactive=True)
+                with gr.Row():
+                    id_api = gr.Textbox(label="Digite sua API (Obrigatório)", interactive=True)
+                    voice_model_input = gr.Dropdown([ voice.name for voice in all_voices], label="Modelo de Voz", value="Adam", interactive=True)
+                    id_voz_input = gr.Textbox(label="Ou digite o ID da voz", interactive=True)
+                gr.Markdown("Abaixo só funciona o Modelo (multilingual_v1,v2,mono), só funciona todas abaixo se tiver com o ID de voz (Por enquanto). <br> <a href='https://api.elevenlabs.io/v1/voices' target='_blank'>Nesse link</a> tem ID de voz, só filtrar por voice_id")
+                with gr.Row():
+                    model_elevenlabs_t = gr.Dropdown(['eleven_multilingual_v2', 'eleven_multilingual_v1', 'eleven_monolingual_v1'], label="Modelo", value='eleven_multilingual_v2', interactive=True)
+                    stability_elevenlabs = gr.Slider(0, 1, step=0.1, label="Establidade", value=0.67, interactive=True)
+                    similarity_boost_elevenlabs = gr.Slider(0, 1, step=0.1, label="Claridade + Similaridade", value=0.8, interactive=True)
+                    style_elevenlabs = gr.Slider(0, 1, step=0.1, label="Exagero de estilo", value=0.0, interactive=True)
+                    use_speaker_boost_elevenlabs = gr.Checkbox(label="Speaker Boost", value=True, interactive=True)
+                gr.Markdown("Se estiver usando huggingface e não rodar, vá em logs, que está acima da imagem do github e veja se já não passou o limite de request da API")
+                audio_output = gr.Audio(label="Resultado", type="filepath", interactive=False)
+                elevenlabs_button = gr.Button(value="Falar")
+                elevenlabs_button.click(fn=elevenlabsAPI, inputs=[audio_input_elevenlabs_api, voice_model_input, model_elevenlabs_t, stability_elevenlabs, similarity_boost_elevenlabs, style_elevenlabs, use_speaker_boost_elevenlabs, id_voz_input, id_api], outputs=[audio_output])
+                clear_button = gr.ClearButton(audio_input_elevenlabs_api, value='Limpar')
+                gr.Markdown("Agradecimentos ao Elevenlabs")
+        with gr.TabItem("Conqui-TTS"):
+            gr.Markdown("Em DEV - Conqui")
+            # Chame a função do arquivo conqui.py para criar os blocos específicos
+            # tabs_conqui = conqui.criar_tab_conqui()
+            # Adicione os blocos criados ao bloco principal
+            # gr.Component(tabs_conqui)
             # Executar o aplicativo Gradio
         gr.Markdown("""
                     Desenvolvido por Rafael Godoy <br>