Spaces:

Merlintxu
/

Diarization

Runtime error

File size: 1,471 Bytes

7b937ef
174a8ef
9275ddd
7b937ef
9275ddd
7b937ef
174a8ef
7b937ef
174a8ef
7b937ef
174a8ef
9275ddd
7b937ef
9275ddd
7b937ef
174a8ef
 
7b937ef
 
 
 
 
 
9275ddd
 
 
 
174a8ef
7b937ef
174a8ef
a74cfe9
7b937ef
9275ddd
7b937ef

# Código para diarización de audio utilizando Transformers
import os
import gradio as gr
from transformers import pipeline

# Cargamos el pipeline preentrenado para diarización de audio
try:
    diarization_pipeline = pipeline(task="automatic-speech-recognition", model="facebook/wav2vec2-large-960h-lv60-self")
except Exception as e:
    diarization_pipeline = None
    print(f"Error cargando el pipeline: {e}")

# Función para realizar la "diarización" de un archivo de audio (en este caso, transcripción básica)
def diarize_audio(file_path):
    if diarization_pipeline is None:
        return "Error: El pipeline no se pudo cargar. Verifica las dependencias."
    
    # Realizar la transcripción del audio
    try:
        transcription = diarization_pipeline(file_path.name)
        result = transcription['text'] if 'text' in transcription else "No se pudo obtener la transcripción."
    except Exception as e:
        result = f"Error durante la transcripción: {e}"
    
    return result

# Interfaz de Gradio
def diarization_interface(file):
    return diarize_audio(file)

audio_input = gr.Audio(type="file", label="Sube tu archivo de audio")
text_output = gr.Textbox(label="Resultados de la Transcripción")

gr.Interface(fn=diarization_interface, inputs=audio_input, outputs=text_output, 
             title="Transcripción de Audio", 
             description="Sube un archivo de audio para obtener la transcripción de los hablantes."
).launch()