Spaces:

Merlintxu
/

Diarization

Runtime error

File size: 1,355 Bytes

9275ddd

# Instalación de las dependencias necesarias
!pip install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cpu
!pip install pyannote.audio

# Código para diarización de audio
import os
from pyannote.audio import Pipeline
import gradio as gr

# Cargamos el pipeline preentrenado para diarización
pipeline = Pipeline.from_pretrained("pyannote/speaker-diarization")

# Función para realizar la diarización de un archivo de audio
def diarize_audio(file_path):
    # Realizar la diarización del audio
    diarization = pipeline(file_path)
    
    # Crear un resultado legible con los segmentos de cada hablante
    result = ""
    for turn, _, speaker in diarization.itertracks(yield_label=True):
        start_time = turn.start
        end_time = turn.end
        result += f"Speaker {speaker} from {start_time:.1f}s to {end_time:.1f}s\n"
    
    return result

# Interfaz de Gradio
def diarization_interface(file):
    return diarize_audio(file.name)

audio_input = gr.inputs.Audio(type="file", label="Sube tu archivo de audio")
text_output = gr.outputs.Textbox(label="Resultados de la Diarización")

gr.Interface(fn=diarization_interface, inputs=audio_input, outputs=text_output, title="Diarización de Audio", description="Sube un archivo de audio para obtener los segmentos de los diferentes hablantes.").launch()