sts

Running

vineelpratap commited on Jun 24, 2024

Commit

d4e3aaf

verified ·

1 Parent(s): b226b85

Update asr.py

Files changed (1) hide show

asr.py CHANGED Viewed

@@ -66,10 +66,19 @@ model = Wav2Vec2ForCTC.from_pretrained(MODEL_ID)
 # )
-def transcribe(
-    audio_data, lang="eng (English)"
-):
-    sr, audio_samples = audio_data
     lang_code = lang.split()[0]
     processor.tokenizer.set_target_lang(lang_code)

 # )
+def transcribe(audio_data, lang="eng (English)"):
+    if isinstance(audio_data, tuple):
+        # microphone
+        sr, audio_samples = audio_data
+        print("case1", audio_samples[:5])
+        assert sr == ASR_SAMPLING_RATE, "Invalid sampling rate"
+    else:
+        # file upload
+        isinstance(audio_data, str)
+        print("case2 1", audio_data)
+        audio_samples = librosa.load(audio_fp, sr=ASR_SAMPLING_RATE, mono=True)[0]
+        print("case2", audio_samples[:5])
     lang_code = lang.split()[0]
     processor.tokenizer.set_target_lang(lang_code)