stt

Runtime error

axxam commited on Dec 18, 2024

Commit

3831911

verified ·

1 Parent(s): 0c12912

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,13 +1,21 @@
 import gradio as gr
 import nemo.collections.asr as nemo_asr
 # Load the pre-trained Kabyle ASR model
 asr_model = nemo_asr.models.EncDecRNNTBPEModel.from_pretrained("nvidia/stt_kab_conformer_transducer_large")
 # Function to transcribe the audio input
 def transcribe(audio):
-    # Transcribe the uploaded audio file and return the result
-    return asr_model.transcribe([audio])
 # Create the Gradio interface with audio input and text output
 iface = gr.Interface(fn=transcribe, inputs="audio", outputs="text")

 import gradio as gr
 import nemo.collections.asr as nemo_asr
+import numpy as np
 # Load the pre-trained Kabyle ASR model
 asr_model = nemo_asr.models.EncDecRNNTBPEModel.from_pretrained("nvidia/stt_kab_conformer_transducer_large")
 # Function to transcribe the audio input
 def transcribe(audio):
+    # Extract audio data and sample rate
+    audio_data, sample_rate = audio
+    # Convert audio data to numpy array if it's not already
+    if isinstance(audio_data, np.ndarray):
+        audio_data = np.array(audio_data)
+    # Transcribe the audio
+    return asr_model.transcribe([audio_data])
 # Create the Gradio interface with audio input and text output
 iface = gr.Interface(fn=transcribe, inputs="audio", outputs="text")