Spaces:

owaski-demo
/

Demo

Sleeping

chinmaydan commited on Feb 27, 2023

Commit

fab312d

1 Parent(s): e16f390

only prints text now (only in english

Files changed (1) hide show

app.py CHANGED Viewed

@@ -7,7 +7,7 @@ model = whisper.load_model("small")
-def predict(audio, mic_audio=None):
     # audio = tuple (sample_rate, frames) or (sample_rate, (frames, channels))
     if mic_audio is not None:
         input_audio = mic_audio
@@ -21,13 +21,13 @@ def predict(audio, mic_audio=None):
     mel = whisper.log_mel_spectrogram(audio).to(model.device)
-    _, probs = model.detect_language(mel)
     options = whisper.DecodingOptions(fp16 = False)
     result = whisper.decode(model, mel, options)
     print(result.text)
-    return result.text

+def predict(audio, mic_audio=None, target_language):
     # audio = tuple (sample_rate, frames) or (sample_rate, (frames, channels))
     if mic_audio is not None:
         input_audio = mic_audio
     mel = whisper.log_mel_spectrogram(audio).to(model.device)
+    language, probs = model.detect_language(mel)
     options = whisper.DecodingOptions(fp16 = False)
     result = whisper.decode(model, mel, options)
     print(result.text)
+    return result.text, result.language