Spaces:

ras0k
/

WhisperX-v2

Runtime error

ras0k commited on Apr 11, 2023

Commit

e9e7628

1 Parent(s): a36e6e8

first real test

Files changed (2) hide show

app.py CHANGED Viewed

@@ -1,7 +1,28 @@
 import gradio as gr
-def greet(name):
-    return "Hello " + name + "!!"
-iface = gr.Interface(fn=greet, inputs="text", outputs="text")
 iface.launch()

 import gradio as gr
+import whisperx
+import whisper
+def transcribe(audio_file):
+    device = "cuda"
+    # Transcribe with original Whisper
+    model = whisper.load_model("large", device)
+    result = model.transcribe(audio_file)
+    # Load alignment model and metadata
+    model_a, metadata = whisperx.load_align_model(language_code=result["language"], device=device)
+    # Align Whisper output
+    result_aligned = whisperx.align(result["segments"], model_a, metadata, audio_file, device)
+    return result_aligned["segments"], result_aligned["word_segments"]
+# Define Gradio interface
+inputs = gr.inputs.Audio(source="upload", type="file")
+outputs = [
+    gr.outputs.Textbox(label="Segments (before alignment)"),
+    gr.outputs.Textbox(label="Segments (after alignment)"),
+]
+iface = gr.Interface(fn=transcribe, inputs=inputs, outputs=outputs, title="WhisperX Transcription")
 iface.launch()

requirements.txt ADDED Viewed


1	+ gradio
2	+ git+https://github.com/m-bain/whisperx.git