Spaces:

Peca33
/

Audio-translator

Sleeping

App Files Files Community

Peca33 commited on Nov 25, 2024

Commit

3498704

verified ·

1 Parent(s): 4c4d83a

actualizacion: traduccion

Browse files

Files changed (1) hide show

app.py +10 -29

app.py CHANGED Viewed

@@ -1,9 +1,3 @@
-"""Proyecto 2: Modelos de IA
-Traducción de audio en español a audio en inglés
-Modelo para la recogida del audio: https://huggingface.co/openai/whisper-large-v3-turbo
-Modelo texto-audio:
-"""
 import whisper
 from transformers import pipeline
 import gradio as gr
@@ -14,18 +8,18 @@ from scipy.io.wavfile import write
 import tempfile
-# Cargar el modelo Whisper-large-v3-turbo
-transcribir = pipeline("automatic-speech-recognition", model="openai/whisper-small")
 bark = pipeline("text-to-speech", model="suno/bark")
-# Función para transcribir el audio
 def transcribir_audio(audio):
     # Usamos el pipeline de Hugging Face para la transcripción
     result = transcribir_audio(audio)
     return result["text"]
 #Función para generar el audio
 def generar_audio(text):
     #Generar audio con Bark
@@ -42,26 +36,14 @@ def generar_audio(text):
 def process_audio(audio_file):
-    # Paso 1: Transcripción con Whisper
-    transcripcion = transcribir(audio_file)["text"]
     # Paso 2: Generación de audio con Bark
-    audio_sintetizado = generar_audio(transcripcion)
-    return transcripcion, audio_sintetizado
-"""# Crear la interfaz de usuario con Gradio
-iface = gr.Interface(
-    fn=transcribir_audio,
-    inputs=gr.Audio(type="filepath"),  # Permite cargar o grabar audio
-    outputs=gr.Audio(type="filepath", label="Tus palabras... pero en inglés"),  # Mostrar la transcripción
-    title="Traductor de voz",
-    description="Carga o graba tu audio para traducirlo al inglés."
-)
-# Iniciar la interfaz
-iface.launch()"""
 # Crear interfaz Gradio
 with gr.Blocks() as demo:
@@ -76,5 +58,4 @@ with gr.Blocks() as demo:
     process_button.click(process_audio, inputs=input_audio, outputs=[transcription_output, output_audio])
 # Lanzar la app
-demo.launch()

 import whisper
 from transformers import pipeline
 import gradio as gr
 import tempfile
+# Cargar el modelo Whisper-small y bark
+transcribir = pipeline("automatic-speech-recognition", model="openai/whisper-small", task="translate")
 bark = pipeline("text-to-speech", model="suno/bark")
+# Función para transcribir el audio y traducir el audio de entrada
 def transcribir_audio(audio):
     # Usamos el pipeline de Hugging Face para la transcripción
     result = transcribir_audio(audio)
     return result["text"]
 #Función para generar el audio
 def generar_audio(text):
     #Generar audio con Bark
 def process_audio(audio_file):
+    # Paso 1: Transcripción y traducción con Whisper
+    transcripcion_traducida = transcribir(audio_file)["text"]
     # Paso 2: Generación de audio con Bark
+    audio_sintetizado = generar_audio(transcripcion_traducida)
+    return transcripcion_traducida, audio_sintetizado
 # Crear interfaz Gradio
 with gr.Blocks() as demo:
     process_button.click(process_audio, inputs=input_audio, outputs=[transcription_output, output_audio])
 # Lanzar la app
+demo.launch()