Spaces:

huedaya
/

hf-openai-whisper-dev

Runtime error

huedaya commited on Apr 22, 2023

Commit

b3b871d

1 Parent(s): 2159625

save

Files changed (1) hide show

app.py CHANGED Viewed

@@ -5,8 +5,9 @@ import whisper
 from flask import Flask, jsonify, request
 import requests
 import time
-model = whisper.load_model("medium")
 app = Flask(__name__)
 app.config['TIMEOUT'] = 60 * 10 # 10 mins
@@ -23,6 +24,13 @@ def runApi():
     response = requests.get(audio_url)
     if response.status_code == requests.codes.ok:
         with open("audio.mp3", "wb") as f:
             f.write(response.content)
@@ -35,15 +43,16 @@ def runApi():
     audio = "audio.mp3"
     audio = whisper.load_audio(audio)
-    audio = whisper.pad_or_trim(audio)
-    mel = whisper.log_mel_spectrogram(audio).to(model.device)
-    _, probs = model.detect_language(mel)
-    options = whisper.DecodingOptions(fp16 = False)
-    result = whisper.decode(model, mel, options)
     end_time = time.time()
     total_time = end_time - start_time

 from flask import Flask, jsonify, request
 import requests
 import time
+from transformers import pipeline
+model = whisper.load_model("small")
 app = Flask(__name__)
 app.config['TIMEOUT'] = 60 * 10 # 10 mins
     response = requests.get(audio_url)
+    pipe = pipeline(
+        "automatic-speech-recognition",
+        model="openai/whisper-large",
+        chunk_length_s=30,
+        device=model.device,
+    )
     if response.status_code == requests.codes.ok:
         with open("audio.mp3", "wb") as f:
             f.write(response.content)
     audio = "audio.mp3"
     audio = whisper.load_audio(audio)
+    # audio = whisper.pad_or_trim(audio)
+    # mel = whisper.log_mel_spectrogram(audio).to(model.device)
+    # _, probs = model.detect_language(mel)
+    # options = whisper.DecodingOptions(fp16 = False)
+    # result = whisper.decode(model, mel, options)
+    result = pipe(audio.copy())["text"]
     end_time = time.time()
     total_time = end_time - start_time