Spaces:

cdactvm
/

demoASR

Sleeping

App Files Files Community

cdactvm commited on Aug 28, 2024

Commit

1035756

verified ·

1 Parent(s): ad35cd7

Update app.py

Browse files

Files changed (1) hide show

app.py +12 -12

app.py CHANGED Viewed

@@ -12,10 +12,10 @@ import re
 # Initialize the speech recognition pipeline and transliterator
 #p1 = pipeline(task="automatic-speech-recognition", model="cdactvm/w2v-bert-2.0-odia_v1")
 #odia_model2 = pipeline(task="automatic-speech-recognition", model="cdactvm/w2v-bert-odia_v1")
-p2 = pipeline(task="automatic-speech-recognition", model="cdactvm/w2v-bert-2.0-hindi_v1")
-punjaib_modle_30000=pipeline(task="automatic-speech-recognition", model="cdactvm/wav2vec-bert-punjabi-30000-model")
 punjaib_modle_155750=pipeline(task="automatic-speech-recognition", model="cdactvm/wav2vec-bert-punjabi-155750-model")
-punjaib_modle_75000=pipeline(task="automatic-speech-recognition", model="cdactvm/wav2vec-bert-punjabi-75000-model")
 #p3 = pipeline(task="automatic-speech-recognition", model="cdactvm/kannada_w2v-bert_model")
 #p4 = pipeline(task="automatic-speech-recognition", model="cdactvm/telugu_w2v-bert_model")
 #p5 = pipeline(task="automatic-speech-recognition", model="Sajjo/w2v-bert-2.0-bangala-gpu-CV16.0_v2")
@@ -288,16 +288,16 @@ def transcribe_punjabi_eng_model_30000(speech):
     return process_transcription(processed_sentence)
     return sentence
-def transcribe_punjabi_75000(speech):
-    text = punjaib_modle_75000(speech)["text"]
     text = text.replace("[PAD]","")
     if text is None:
         return "Error: ASR returned None"
     return text
-def transcribe_punjabi_eng_model_75000(speech):
     trn = Transliterator(source='pan', target='eng', build_lookup=True)
-    text = punjaib_modle_75000(speech)["text"]
     text = text.replace("[PAD]","")
     if text is None:
         return "Error: ASR returned None"
@@ -560,10 +560,10 @@ def sel_lng(lng, mic=None, file=None):
        return transcribe_punjabi_30000(audio)
     elif lng == "Punjabi_Model1_Trans":
        return transcribe_punjabi_eng_model_30000(audio)
-    elif lng == "Punjabi_Model2":
-       return transcribe_punjabi_75000(audio)
-    elif lng == "Punjabi_Model2_Trans":
-       return transcribe_punjabi_eng_model_75000(audio)
     elif lng == "Punjabi_Model3":
        return transcribe_punjabi_155750(audio)
     elif lng == "Punjabi_Model3_Trans":
@@ -605,7 +605,7 @@ demo=gr.Interface(
             # "Hindi","Hindi-trans",
             # "Odiya","Odiya-trans","Odia_model2","Odia_trans_model2",
             # "Assamese-LM","Assamese-Model2",
-            "Punjabi_Model1","Punjabi_Model1_Trans","Punjabi_Model2","Punjabi_Model2_Trans","Punjabi_Model3","Punjabi_Model3_Trans"],value="Hindi",label="Select Language"),
         gr.Audio(sources=["microphone","upload"], type="filepath"),
         #gr.Audio(sources="upload", type="filepath"),
         #"state"

 # Initialize the speech recognition pipeline and transliterator
 #p1 = pipeline(task="automatic-speech-recognition", model="cdactvm/w2v-bert-2.0-odia_v1")
 #odia_model2 = pipeline(task="automatic-speech-recognition", model="cdactvm/w2v-bert-odia_v1")
+# p2 = pipeline(task="automatic-speech-recognition", model="cdactvm/w2v-bert-2.0-hindi_v1")
+# punjaib_modle_30000=pipeline(task="automatic-speech-recognition", model="cdactvm/wav2vec-bert-punjabi-30000-model")
 punjaib_modle_155750=pipeline(task="automatic-speech-recognition", model="cdactvm/wav2vec-bert-punjabi-155750-model")
+punjaib_modle_70000_aug=pipeline(task="automatic-speech-recognition", model="cdactvm/w2v-bert-model-70000-augmented")
 #p3 = pipeline(task="automatic-speech-recognition", model="cdactvm/kannada_w2v-bert_model")
 #p4 = pipeline(task="automatic-speech-recognition", model="cdactvm/telugu_w2v-bert_model")
 #p5 = pipeline(task="automatic-speech-recognition", model="Sajjo/w2v-bert-2.0-bangala-gpu-CV16.0_v2")
     return process_transcription(processed_sentence)
     return sentence
+def transcribe_punjabi_70000_aug(speech):
+    text = punjaib_modle_70000_aug(speech)["text"]
     text = text.replace("[PAD]","")
     if text is None:
         return "Error: ASR returned None"
     return text
+def transcribe_punjabi_eng_model_70000_aug(speech):
     trn = Transliterator(source='pan', target='eng', build_lookup=True)
+    text = punjaib_modle_70000_aug(speech)["text"]
     text = text.replace("[PAD]","")
     if text is None:
         return "Error: ASR returned None"
        return transcribe_punjabi_30000(audio)
     elif lng == "Punjabi_Model1_Trans":
        return transcribe_punjabi_eng_model_30000(audio)
+    elif lng == "Punjabi_Model_aug":
+       return transcribe_punjabi_70000_aug(audio)
+    elif lng == "Punjabi_Model_aug_Trans":
+       return transcribe_punjabi_eng_model_70000_aug(audio)
     elif lng == "Punjabi_Model3":
        return transcribe_punjabi_155750(audio)
     elif lng == "Punjabi_Model3_Trans":
             # "Hindi","Hindi-trans",
             # "Odiya","Odiya-trans","Odia_model2","Odia_trans_model2",
             # "Assamese-LM","Assamese-Model2",
+            "Punjabi_Model1","Punjabi_Model1_Trans","Punjabi_Model_aug","Punjabi_Model_aug_Trans","Punjabi_Model3","Punjabi_Model3_Trans"],value="Hindi",label="Select Language"),
         gr.Audio(sources=["microphone","upload"], type="filepath"),
         #gr.Audio(sources="upload", type="filepath"),
         #"state"