Spaces:

alex16052G
/

abi

Paused

App Files Files Community

alex16052G commited on Jan 22

Commit

576e1e2

verified ·

1 Parent(s): c761f75

Update chat_ai.py

Browse files

Files changed (1) hide show

chat_ai.py +60 -46

chat_ai.py CHANGED Viewed

@@ -147,6 +147,13 @@ def transcribe_audio(audio_path):
         print(f"Error en transcribe_audio: {e}")
         return None
 @gpu_decorator
 def generate_audio(text, ref_audio, ref_text, model_choice, remove_silence):
     """Genera el audio a partir del texto ingresado utilizando la voz de referencia."""
@@ -193,52 +200,6 @@ def generate_audio(text, ref_audio, ref_text, model_choice, remove_silence):
         print(f"Error en generate_audio: {e}")
         return None, "Ocurrió un error al generar el audio."
-with gr.Blocks() as app:
-    gr.Markdown(
-        """
-# Conversor de Texto a Voz con Clonación de Voz
-Sube un audio de referencia para clonar la voz y luego escribe el texto que deseas convertir a voz.
-        """
-    )
-    with gr.Row():
-        with gr.Column():
-            ref_audio = gr.Audio(label="Audio de Referencia (Clonación de Voz)", type="filepath")
-            ref_text = gr.Textbox(
-                label="Texto de Referencia (Opcional)",
-                info="Opcional: Deja en blanco para transcribir automáticamente el audio de referencia",
-                lines=2,
-            )
-        with gr.Column():
-            model_choice = gr.Radio(
-                choices=["F5-TTS"],
-                label="Modelo TTS",
-                value="F5-TTS",
-            )
-            remove_silence = gr.Checkbox(
-                label="Eliminar Silencios",
-                value=True,
-            )
-    with gr.Row():
-        text_input = gr.Textbox(
-            label="Escribe tu texto",
-            placeholder="Ingresa el texto que deseas convertir a voz...",
-            lines=3,
-        )
-        generate_btn = gr.Button("Generar Audio")
-    with gr.Row():
-        audio_output = gr.Audio(label="Audio Generado", autoplay=True)
-    status = gr.Textbox(label="Estado", interactive=False)
-    generate_btn.click(
-        generate_audio,
-        inputs=[text_input, ref_audio, ref_text, model_choice, remove_silence],
-        outputs=[audio_output, status],
-    )
 @click.command()
 @click.option("--port", "-p", default=None, type=int, help="Puerto para ejecutar la aplicación")
 @click.option("--host", "-H", default=None, help="Host para ejecutar la aplicación")
@@ -261,6 +222,59 @@ def main(port, host, share, api):
     )
 if __name__ == "__main__":
     if not USING_SPACES:
         main()
     else:

         print(f"Error en transcribe_audio: {e}")
         return None
+def transcribe_and_update(audio_path):
+    """Transcribe el audio de referencia y devuelve el texto transcrito."""
+    transcription = transcribe_audio(audio_path)
+    if transcription is None:
+        return "Error al transcribir el audio de referencia."
+    return transcription
 @gpu_decorator
 def generate_audio(text, ref_audio, ref_text, model_choice, remove_silence):
     """Genera el audio a partir del texto ingresado utilizando la voz de referencia."""
         print(f"Error en generate_audio: {e}")
         return None, "Ocurrió un error al generar el audio."
 @click.command()
 @click.option("--port", "-p", default=None, type=int, help="Puerto para ejecutar la aplicación")
 @click.option("--host", "-H", default=None, help="Host para ejecutar la aplicación")
     )
 if __name__ == "__main__":
+    with gr.Blocks() as app:
+        gr.Markdown(
+            """
+# Conversor de Texto a Voz con Clonación de Voz
+Sube un audio de referencia para clonar la voz y luego escribe el texto que deseas convertir a voz.
+            """
+        )
+        with gr.Row():
+            with gr.Column():
+                ref_audio = gr.Audio(label="Audio de Referencia (Clonación de Voz)", type="filepath")
+                ref_text = gr.Textbox(
+                    label="Texto de Referencia (Opcional)",
+                    info="Opcional: Deja en blanco para transcribir automáticamente el audio de referencia",
+                    lines=2,
+                )
+            with gr.Column():
+                model_choice = gr.Radio(
+                    choices=["F5-TTS"],
+                    label="Modelo TTS",
+                    value="F5-TTS",
+                )
+                remove_silence = gr.Checkbox(
+                    label="Eliminar Silencios",
+                    value=True,
+                )
+        with gr.Row():
+            text_input = gr.Textbox(
+                label="Escribe tu texto",
+                placeholder="Ingresa el texto que deseas convertir a voz...",
+                lines=3,
+            )
+            generate_btn = gr.Button("Generar Audio")
+        with gr.Row():
+            audio_output = gr.Audio(label="Audio Generado", autoplay=True)
+        status = gr.Textbox(label="Estado", interactive=False)
+        # Conectar la función de transcripción al evento de cambio del audio de referencia
+        ref_audio.change(
+            fn=transcribe_and_update,
+            inputs=ref_audio,
+            outputs=ref_text,
+        )
+        generate_btn.click(
+            generate_audio,
+            inputs=[text_input, ref_audio, ref_text, model_choice, remove_silence],
+            outputs=[audio_output, status],
+        )
     if not USING_SPACES:
         main()
     else: