Spaces:

geokanaan
/

arabeasy

Sleeping

geokanaan commited on Nov 1, 2023

Commit

2c0f3d8

1 Parent(s): 39c68a9

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -5,9 +5,11 @@ import os
 pipe = pipeline(task="automatic-speech-recognition", model="geokanaan/Whisper_Base_Lebanese_Arabizi")
 def transcribe(audio):
-    text = pipe(audio)
-    return text["text"]
 HF_TOKEN = os.getenv('WRITE')
 #hf_writer = gr.HuggingFaceDatasetSaver(HF_TOKEN, "geokanaan/flagged_Audio_Lebanese")
@@ -15,7 +17,7 @@ HF_TOKEN = os.getenv('WRITE')
 iface = gr.Interface(
     fn=transcribe,
     inputs=[
-        gr.Audio(sources="microphone",type= "filepath")
     ],
     outputs="text",
     title="arabeasy",

 pipe = pipeline(task="automatic-speech-recognition", model="geokanaan/Whisper_Base_Lebanese_Arabizi")
 def transcribe(audio):
+    sr, y = audio
+    y = y.astype(np.float32)
+    y /= np.max(np.abs(y))
+    return pipe({"sampling_rate": sr, "raw": y})["text"]
 HF_TOKEN = os.getenv('WRITE')
 #hf_writer = gr.HuggingFaceDatasetSaver(HF_TOKEN, "geokanaan/flagged_Audio_Lebanese")
 iface = gr.Interface(
     fn=transcribe,
     inputs=[
+        gr.Audio(sources="microphone")
     ],
     outputs="text",
     title="arabeasy",