Spaces:

Nitzantry1
/

diarization_try1

Sleeping

File size: 1,031 Bytes

import gradio as gr
from pyannote.audio import Pipeline
import os

# טוען את ה-Token ממערכת משתני הסביבה
auth_token = os.getenv("HF_AUTH_TOKEN")

# טוען את המודל של Pyannote לזיהוי דוברים עם ה-Token
pipeline = Pipeline.from_pretrained("pyannote/speaker-diarization", use_auth_token=auth_token)

# פונקציה לביצוע זיהוי דוברים
def diarize(audio_file):
    diarization = pipeline(audio_file)
    segments = []
    for turn, _, speaker in diarization.itertracks(yield_label=True):
        segments.append({
            "start": turn.start,
            "end": turn.end,
            "speaker": speaker
        })
    return segments

# הגדרת ממשק Gradio
interface = gr.Interface(
    fn=diarize, 
    inputs=gr.Audio(type="filepath"),  # שימוש בפרמטר המתאים של Gradio
    outputs="json",
    description="Upload an audio file to get speaker diarization (timestamps and speaker IDs only)."
)

# הרצת הממשק
interface.launch()