Spaces:

owaski-demo
/

Demo

Sleeping

chinmaydan commited on Feb 27, 2023

Commit

47bfd84

1 Parent(s): 666f810

accepting input from upload or mic

Files changed (1) hide show

app.py CHANGED Viewed

@@ -3,13 +3,21 @@ os.system("pip install git+https://github.com/openai/whisper.git")
 import gradio as gr
 import whisper
-from transformers import WhisperProcessor, WhisperForConditionalGeneration
 model = whisper.load_model("small")
-def inference(audio):
-    audio = whisper.load_audio(audio)
     audio = whisper.pad_or_trim(audio)
     mel = whisper.log_mel_spectrogram(audio).to(model.device)
@@ -23,6 +31,7 @@ def inference(audio):
     return result.text, gr.update(visible=True), gr.update(visible=True), gr.update(visible=True)
 title = "Demo for Whisper -> Something -> XLS-R"
 description = """
@@ -31,7 +40,7 @@ being passed into the model. The output is the text transcription of the audio.
 """
 gr.Interface(
-    fn=inference,
     inputs=[
         gr.Audio(label="Upload Speech", source="upload", type="numpy"),
         gr.Audio(label="Record Speech", source="microphone", type="numpy"),

 import gradio as gr
 import whisper
 model = whisper.load_model("small")
+model.config.forced_decoder_ids = None
+def predict(audio, mic_audio=None):
+    # audio = tuple (sample_rate, frames) or (sample_rate, (frames, channels))
+    if mic_audio is not None:
+        sampling_rate, waveform = mic_audio
+    elif audio is not None:
+        sampling_rate, waveform = audio
+    else:
+        return "(please provide audio)"
+    audio = whisper.load_audio(waveform)
     audio = whisper.pad_or_trim(audio)
     mel = whisper.log_mel_spectrogram(audio).to(model.device)
     return result.text, gr.update(visible=True), gr.update(visible=True), gr.update(visible=True)
 title = "Demo for Whisper -> Something -> XLS-R"
 description = """
 """
 gr.Interface(
+    fn=predict,
     inputs=[
         gr.Audio(label="Upload Speech", source="upload", type="numpy"),
         gr.Audio(label="Record Speech", source="microphone", type="numpy"),