Spaces:

Peca33
/

Audio-translator

Sleeping

Peca33 commited on Nov 25, 2024

Commit

89c5d72

verified ·

1 Parent(s): 6e5e148

ojú

Files changed (1) hide show

app.py CHANGED Viewed

@@ -10,6 +10,7 @@ import tempfile
 # Cargar el modelo Whisper-small y bark
 transcribir = pipeline("automatic-speech-recognition", model="openai/whisper-small")
 # Función para transcribir el audio y traducir el audio de entrada
@@ -19,29 +20,29 @@ def transcribir_audio(audio):
     return result["text"]
-#Función para generar el audio
 def generar_audio(text):
-    #Generar audio con Bark
     audio_array = generate_audio(text)
-    # Normalizar el array de audio (opcional si Bark ya devuelve datos normalizados)
-    audio_array = np.clip(audio_array, -1.0, 1.0)  # Asegurar que los valores estén en [-1.0, 1.0]
-     # Crear un archivo temporal para almacenar el audio
     temp_wav = tempfile.NamedTemporaryFile(delete=False, suffix=".wav")
-    write(temp_wav.name, 24000, (audio_array * 32767).astype(np.int16))  # Guardar el archivo como WAV
     return temp_wav.name
 def process_audio(audio_file):
-    # Paso 1: Transcripción y traducción con Whisper
-    transcripcion_traducida = transcribir(audio_file)
-    # Paso 2: Generación de audio con Bark
-    audio_sintetizado = generar_audio(transcripcion_traducida)
-    return transcripcion_traducida, audio_sintetizado
 # Crear interfaz Gradio

 # Cargar el modelo Whisper-small y bark
 transcribir = pipeline("automatic-speech-recognition", model="openai/whisper-small")
+"""bark = pipeline("text-to-speech", model="suno/bark")"""
 # Función para transcribir el audio y traducir el audio de entrada
     return result["text"]
+# Función para generar el audio
 def generar_audio(text):
+    if not isinstance(text, str):
+        raise ValueError("El texto debe ser una cadena")
     audio_array = generate_audio(text)
+    audio_array = np.clip(audio_array, -1.0, 1.0)
     temp_wav = tempfile.NamedTemporaryFile(delete=False, suffix=".wav")
+    write(temp_wav.name, 24000, (audio_array * 32767).astype(np.int16))
     return temp_wav.name
 def process_audio(audio_file):
+    try:
+        # Paso 1: Transcripción y traducción con Whisper
+        transcripcion_traducida = transcribir_audio(audio_file)
+        # Paso 2: Generación de audio con Bark
+        audio_sintetizado = generar_audio(transcripcion_traducida)
+        return transcripcion_traducida, audio_sintetizado
+    except Exception as e:
+        return str(e), None
 # Crear interfaz Gradio