NbAiLab
/

wav2vec2-xlsr-300M-NPSC

Automatic Speech Recognition

Model card Files Files and versions Metrics Training metrics Community

pere commited on Jan 29, 2022

Commit

f45805f

·

1 Parent(s): d740190

first

Files changed (2) hide show

run.sh +3 -2
run_speech_recognition_ctc.py +1 -1

run.sh CHANGED Viewed

@@ -1,10 +1,11 @@
 python run_speech_recognition_ctc.py \
         --dataset_name="NbAiLab/NPSC" \
         --model_name_or_path="facebook/wav2vec2-xls-r-300m" \
-        --dataset_config_name="16K_mp3" \
         --output_dir="./" \
         --overwrite_output_dir \
-        --num_train_epochs="50" \
         --per_device_train_batch_size="8" \
         --per_device_eval_batch_size="8" \
         --gradient_accumulation_steps="4" \

 python run_speech_recognition_ctc.py \
         --dataset_name="NbAiLab/NPSC" \
         --model_name_or_path="facebook/wav2vec2-xls-r-300m" \
+        --hub_model_id="NbAiLab/wav2vec2-xlsr-300M-NPSC" \
+	--dataset_config_name="16K_mp3" \
         --output_dir="./" \
         --overwrite_output_dir \
+        --num_train_epochs="75" \
         --per_device_train_batch_size="8" \
         --per_device_eval_batch_size="8" \
         --gradient_accumulation_steps="4" \

run_speech_recognition_ctc.py CHANGED Viewed

@@ -393,7 +393,7 @@ def main():
     # Pre-processing dataset
     import re
-     def filter_inaudible(entry):
         return not re.search("\d|<inaudible>", entry["text"], flags=re.IGNORECASE)
     def filter_nynorsk(entry):

     # Pre-processing dataset
     import re
+    def filter_inaudible(entry):
         return not re.search("\d|<inaudible>", entry["text"], flags=re.IGNORECASE)
     def filter_nynorsk(entry):