Spaces:

owaski-demo
/

Demo

Sleeping

chinmaydan commited on Feb 27, 2023

Commit

88413ab

1 Parent(s): 84718ed

troubleshooting the detect language part

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,11 +1,14 @@
 import os
 os.system("pip install git+https://github.com/openai/whisper.git")
 import gradio as gr
 import whisper
 model = whisper.load_model("small")
 language_id_lookup = {
             "English"   : "en",
             "German"    : "de",
@@ -22,8 +25,13 @@ language_id_lookup = {
             }
 def predict(audio, language, mic_audio=None):
-    # audio = tuple (sample_rate, frames) or (sample_rate, (frames, channels))
     if mic_audio is not None:
         input_audio = mic_audio
     elif audio is not None:
@@ -37,7 +45,7 @@ def predict(audio, language, mic_audio=None):
     mel = whisper.log_mel_spectrogram(audio).to(model.device)
     if(language == "Detect Language"):
-        outLanguage, probs = model.detect_language(mel)
         print("Detected language is: " + outLanguage)
     else:
         outLanguage = language_id_lookup[language.split()[0]]

+# imports
 import os
 os.system("pip install git+https://github.com/openai/whisper.git")
 import gradio as gr
 import whisper
+# the model we are using for ASR, options are small, medium, large and largev2 (large and largev2 don't fit on huggingface cpu)
 model = whisper.load_model("small")
+# A table to look up all the languages
 language_id_lookup = {
             "English"   : "en",
             "German"    : "de",
             }
+# The predict function. audio, language and mic_audio are all parameters directly passed by gradio
+# which means they are user inputted. They are specified in gr.inputs[] block at the bottom. The
+# gr.outputs[] block will specify the output type.
 def predict(audio, language, mic_audio=None):
+    # checks if mic_audio is used, otherwise feeds model uploaded audio
     if mic_audio is not None:
         input_audio = mic_audio
     elif audio is not None:
     mel = whisper.log_mel_spectrogram(audio).to(model.device)
     if(language == "Detect Language"):
+        outLanguage, probs = model._detect_language(mel)
         print("Detected language is: " + outLanguage)
     else:
         outLanguage = language_id_lookup[language.split()[0]]