Spaces:

Peca33
/

Audio-translator

Sleeping

Peca33 commited on Nov 25, 2024

Commit

81a55fb

verified ·

1 Parent(s): 89c5d72

sugerencia perplexity

Files changed (1) hide show

app.py CHANGED Viewed

@@ -7,19 +7,14 @@ from bark import generate_audio
 from scipy.io.wavfile import write
 import tempfile
-# Cargar el modelo Whisper-small y bark
 transcribir = pipeline("automatic-speech-recognition", model="openai/whisper-small")
-"""bark = pipeline("text-to-speech", model="suno/bark")"""
 # Función para transcribir el audio y traducir el audio de entrada
 def transcribir_audio(audio):
-    # Usamos el pipeline de Hugging Face para la transcripción
-    result = transcribir_audio(audio_file, task="translate")
     return result["text"]
 # Función para generar el audio
 def generar_audio(text):
     if not isinstance(text, str):
@@ -29,7 +24,6 @@ def generar_audio(text):
     temp_wav = tempfile.NamedTemporaryFile(delete=False, suffix=".wav")
     write(temp_wav.name, 24000, (audio_array * 32767).astype(np.int16))
     return temp_wav.name
 def process_audio(audio_file):
     try:
@@ -43,8 +37,6 @@ def process_audio(audio_file):
     except Exception as e:
         return str(e), None
 # Crear interfaz Gradio
 with gr.Blocks() as demo:
     gr.Markdown("### Transcripción y Síntesis de Voz")
@@ -58,4 +50,4 @@ with gr.Blocks() as demo:
     process_button.click(process_audio, inputs=input_audio, outputs=[transcription_output, output_audio])
 # Lanzar la app
-demo.launch(share=True)

 from scipy.io.wavfile import write
 import tempfile
+# Cargar el modelo Whisper-small
 transcribir = pipeline("automatic-speech-recognition", model="openai/whisper-small")
 # Función para transcribir el audio y traducir el audio de entrada
 def transcribir_audio(audio):
+    result = transcribir(audio, task="translate")
     return result["text"]
 # Función para generar el audio
 def generar_audio(text):
     if not isinstance(text, str):
     temp_wav = tempfile.NamedTemporaryFile(delete=False, suffix=".wav")
     write(temp_wav.name, 24000, (audio_array * 32767).astype(np.int16))
     return temp_wav.name
 def process_audio(audio_file):
     try:
     except Exception as e:
         return str(e), None
 # Crear interfaz Gradio
 with gr.Blocks() as demo:
     gr.Markdown("### Transcripción y Síntesis de Voz")
     process_button.click(process_audio, inputs=input_audio, outputs=[transcription_output, output_audio])
 # Lanzar la app
+demo.launch(share=True)