Spaces:

cdactvm
/

Tamil_ASR_Demo

Running

cdactvm commited on Dec 9, 2024

Commit

903b6ff

verified ·

1 Parent(s): 1d22a62

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -31,9 +31,9 @@ from waveletDenoise import wavelet_denoise
-transcriber_hindi_new = pipeline(task="automatic-speech-recognition", model="cdactvm/w2v-bert-2.0-hindi_new")
-transcriber_hindi_old = pipeline(task="automatic-speech-recognition", model="cdactvm/huggingface-hindi_model")
-processor = AutoProcessor.from_pretrained("cdactvm/w2v-bert-2.0-hindi_new")
 vocab_dict = processor.tokenizer.get_vocab()
 sorted_vocab_dict = {k.lower(): v for k, v in sorted(vocab_dict.items(), key=lambda item: item[1])}
 decoder = build_ctcdecoder(
@@ -46,7 +46,7 @@ processor_with_lm = Wav2Vec2ProcessorWithLM(
     decoder=decoder
     )
 processor.feature_extractor._processor_class = "Wav2Vec2ProcessorWithLM"
-transcriber_hindi_lm = pipeline("automatic-speech-recognition", model="cdactvm/w2v-bert-2.0-hindi_new", tokenizer=processor_with_lm, feature_extractor=processor_with_lm.feature_extractor, decoder=processor_with_lm.decoder)
 def transcribe_hindi_new(audio):

+transcriber_hindi_new = pipeline(task="automatic-speech-recognition", model="cdactvm/w2v-bert-tamil_new")
+transcriber_hindi_old = pipeline(task="automatic-speech-recognition", model="cdactvm/w2v-bert-tamil_new")
+processor = AutoProcessor.from_pretrained("cdactvm/cdactvm/w2v-bert-tamil_new")
 vocab_dict = processor.tokenizer.get_vocab()
 sorted_vocab_dict = {k.lower(): v for k, v in sorted(vocab_dict.items(), key=lambda item: item[1])}
 decoder = build_ctcdecoder(
     decoder=decoder
     )
 processor.feature_extractor._processor_class = "Wav2Vec2ProcessorWithLM"
+transcriber_hindi_lm = pipeline("automatic-speech-recognition", model="cdactvm/w2v-bert-tamil_new", tokenizer=processor_with_lm, feature_extractor=processor_with_lm.feature_extractor, decoder=processor_with_lm.decoder)
 def transcribe_hindi_new(audio):