Spaces:

camanalo1
/

MyAlexa

Sleeping

camanalo1 commited on Apr 30, 2024

Commit

63033c7

1 Parent(s): d70e1b9

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,24 +1,21 @@
 import gradio as gr
-from nemo.collections.asr.models import EncDecMultiTaskModel
-# Load the model
-canary_model = EncDecMultiTaskModel.from_pretrained('nvidia/canary-1b')
-# Define ASR function
 def transcribe_audio(audio):
     # Perform transcription
-    predicted_text = canary_model.transcribe(
-        paths2audio_files=[audio.name],
-        batch_size=16  # Batch size for inference
-    )
-    return predicted_text[0]
-# Interface with microphone input
 inputs = gr.inputs.Microphone(label="Speak into the microphone")
 outputs = gr.outputs.Textbox(label="Transcription")
-title = "Canary ASR"
 description = "Transcribe speech from the microphone using the NeMo Canary ASR model."
 interface = gr.Interface(transcribe_audio, inputs, outputs, title=title, description=description)
-# Launch interface
 interface.launch()

 import gradio as gr
+from nemo.collections.asr.models import ASRModel
+# Load the ASR model
+model = ASRModel.from_pretrained("nvidia/canary-1b")
+# Define a function to transcribe audio from the microphone
 def transcribe_audio(audio):
     # Perform transcription
+    transcription = model.transcribe([audio])[0]
+    return transcription
+# Interface with microphone input and text output
 inputs = gr.inputs.Microphone(label="Speak into the microphone")
 outputs = gr.outputs.Textbox(label="Transcription")
+title = "Speech-to-Text Transcription"
 description = "Transcribe speech from the microphone using the NeMo Canary ASR model."
 interface = gr.Interface(transcribe_audio, inputs, outputs, title=title, description=description)
+# Launch the interface
 interface.launch()