Spaces:

Merlintxu
/

Diarization

Runtime error

Merlintxu commited on Nov 7, 2024

Commit

7b937ef

verified ·

1 Parent(s): 174a8ef

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,37 +1,37 @@
-# Código para diarización de audio
 import os
-from pyannote.audio import Pipeline
 import gradio as gr
-# Cargamos el pipeline preentrenado para diarización
 try:
-    pipeline = Pipeline.from_pretrained("pyannote/speaker-diarization")
 except Exception as e:
-    pipeline = None
     print(f"Error cargando el pipeline: {e}")
-# Función para realizar la diarización de un archivo de audio
 def diarize_audio(file_path):
-    if pipeline is None:
         return "Error: El pipeline no se pudo cargar. Verifica las dependencias."
-    # Realizar la diarización del audio
-    diarization = pipeline(file_path)
-    # Crear un resultado legible con los segmentos de cada hablante
-    result = ""
-    for turn, _, speaker in diarization.itertracks(yield_label=True):
-        start_time = turn.start
-        end_time = turn.end
-        result += f"Speaker {speaker} from {start_time:.1f}s to {end_time:.1f}s\n"
     return result
 # Interfaz de Gradio
 def diarization_interface(file):
-    return diarize_audio(file.name)
 audio_input = gr.Audio(type="file", label="Sube tu archivo de audio")
-text_output = gr.Textbox(label="Resultados de la Diarización")
-gr.Interface(fn=diarization_interface, inputs=audio_input, outputs=text_output, title="Diarización de Audio", description="Sube un archivo de audio para obtener los segmentos de los diferentes hablantes.").launch()

+# Código para diarización de audio utilizando Transformers
 import os
 import gradio as gr
+from transformers import pipeline
+# Cargamos el pipeline preentrenado para diarización de audio
 try:
+    diarization_pipeline = pipeline(task="automatic-speech-recognition", model="facebook/wav2vec2-large-960h-lv60-self")
 except Exception as e:
+    diarization_pipeline = None
     print(f"Error cargando el pipeline: {e}")
+# Función para realizar la "diarización" de un archivo de audio (en este caso, transcripción básica)
 def diarize_audio(file_path):
+    if diarization_pipeline is None:
         return "Error: El pipeline no se pudo cargar. Verifica las dependencias."
+    # Realizar la transcripción del audio
+    try:
+        transcription = diarization_pipeline(file_path.name)
+        result = transcription['text'] if 'text' in transcription else "No se pudo obtener la transcripción."
+    except Exception as e:
+        result = f"Error durante la transcripción: {e}"
     return result
 # Interfaz de Gradio
 def diarization_interface(file):
+    return diarize_audio(file)
 audio_input = gr.Audio(type="file", label="Sube tu archivo de audio")
+text_output = gr.Textbox(label="Resultados de la Transcripción")
+gr.Interface(fn=diarization_interface, inputs=audio_input, outputs=text_output,
+             title="Transcripción de Audio",
+             description="Sube un archivo de audio para obtener la transcripción de los hablantes."
+).launch()