ai4bharat_indicwave2vec_models

Sleeping

App Files Files Community

Add-Vishnu commited on Nov 3, 2023

Commit

078404b

1 Parent(s): 33dd3df

Update app.py

Browse files

Files changed (1) hide show

app.py +11 -8

app.py CHANGED Viewed

@@ -9,11 +9,12 @@ transcriber_bengali = pipeline("automatic-speech-recognition", model="ai4bharat/
 transcriber_odia = pipeline("automatic-speech-recognition", model="ai4bharat/indicwav2vec-odia")
 transcriber_gujarati = pipeline("automatic-speech-recognition", model="ai4bharat/indicwav2vec_v1_gujarati")
 # transcriber_telugu = pipeline("automatic-speech-recognition", model="ai4bharat/indicwav2vec_v1_telugu")
-transcriber_sinhala = pipeline("automatic-speech-recognition", model="ai4bharat/indicwav2vec_v1_sinhala")
-transcriber_tamil = pipeline("automatic-speech-recognition", model="ai4bharat/indicwav2vec_v1_tamil")
-transcriber_nepali = pipeline("automatic-speech-recognition", model="ai4bharat/indicwav2vec_v1_nepali")
-transcriber_marathi = pipeline("automatic-speech-recognition", model="ai4bharat/indicwav2vec_v1_marathi")
 def resample_to_16k(audio, orig_sr):
     y_resampled = librosa.resample(y=audio, orig_sr=orig_sr, target_sr=16000)
@@ -24,8 +25,8 @@ def transcribe(audio,lang="hindi"):
     y = y.astype(np.float32)
     y/= np.max(np.abs(y))
     y_resampled = resample_to_16k(y,sr)
-    if lang=="telugu":
-        return "No Model","So no time!"
     pipe= eval(f'transcriber_{lang}')
     start_time = time.time()
     trans = pipe(y_resampled)
@@ -35,7 +36,9 @@ def transcribe(audio,lang="hindi"):
 demo = gr.Interface(
             transcribe,
-            inputs=["microphone",gr.Radio(["hindi","bangali","odia","gujarati","telugu","sinhala","tamil","nepali","marathi"],value="hindi")],
             outputs=["text","text"],
-            examples=[["./Samples/Hindi_1.mp3","hindi"],["./Samples/Hindi_2.mp3","hindi"],["./Samples/Tamil_1.mp3","tamil"],["./Samples/Tamil_2.mp3","hindi"],["./Samples/Nepal_1.mp3","nepali"],["./Samples/Nepal_2.mp3","nepali"],["./Samples/Marathi_1.mp3","marathi"],["./Samples/Marathi_2.mp3","marathi"],["./Samples/climate ex short.wav","hindi"]])
 demo.launch()

 transcriber_odia = pipeline("automatic-speech-recognition", model="ai4bharat/indicwav2vec-odia")
 transcriber_gujarati = pipeline("automatic-speech-recognition", model="ai4bharat/indicwav2vec_v1_gujarati")
 # transcriber_telugu = pipeline("automatic-speech-recognition", model="ai4bharat/indicwav2vec_v1_telugu")
+# transcriber_sinhala = pipeline("automatic-speech-recognition", model="ai4bharat/indicwav2vec_v1_sinhala")
+# transcriber_tamil = pipeline("automatic-speech-recognition", model="ai4bharat/indicwav2vec_v1_tamil")
+# transcriber_nepali = pipeline("automatic-speech-recognition", model="ai4bharat/indicwav2vec_v1_nepali")
+# transcriber_marathi = pipeline("automatic-speech-recognition", model="ai4bharat/indicwav2vec_v1_marathi")
+languages = ["hindi","bangali","odia","gujarati"]
 def resample_to_16k(audio, orig_sr):
     y_resampled = librosa.resample(y=audio, orig_sr=orig_sr, target_sr=16000)
     y = y.astype(np.float32)
     y/= np.max(np.abs(y))
     y_resampled = resample_to_16k(y,sr)
+    if lang not in languages:
+        return "No Model","So Stay tuned!"
     pipe= eval(f'transcriber_{lang}')
     start_time = time.time()
     trans = pipe(y_resampled)
 demo = gr.Interface(
             transcribe,
+            inputs=["microphone",gr.Radio(["hindi","bangali","odia","gujarati"],value="hindi")],
+            # inputs=["microphone",gr.Radio(["hindi","bangali","odia","gujarati","telugu","sinhala","tamil","nepali","marathi"],value="hindi")],
             outputs=["text","text"],
+            examples=[["./Samples/Hindi_1.mp3","hindi"],["./Samples/Hindi_2.mp3","hindi"],["./Samples/Tamil_2.mp3","hindi"],["./Samples/climate ex short.wav","hindi"]])
+            # examples=[["./Samples/Hindi_1.mp3","hindi"],["./Samples/Hindi_2.mp3","hindi"],["./Samples/Tamil_1.mp3","tamil"],["./Samples/Tamil_2.mp3","hindi"],["./Samples/Nepal_1.mp3","nepali"],["./Samples/Nepal_2.mp3","nepali"],["./Samples/Marathi_1.mp3","marathi"],["./Samples/Marathi_2.mp3","marathi"],["./Samples/climate ex short.wav","hindi"]])
 demo.launch()