KBLab
/

wav2vec2-large-xlsr-53-swedish

Automatic Speech Recognition

xlsr-fine-tuning-week

Inference Endpoints

Model card Files Files and versions Community

marma commited on Mar 29, 2021

Commit

946353f

·

1 Parent(s): 04c1fce

Update README.md

Files changed (1) hide show

README.md +13 -4

README.md CHANGED Viewed

@@ -1,5 +1,11 @@
 ---
-language: sv
 tags:
 - audio
 - automatic-speech-recognition
@@ -15,11 +21,14 @@ model-index:
     dataset:
       name: Common Voice sv-SE
       type: common_voice
-      args: sv
     metrics:
        - name: Test WER
          type: wer
-         value: 20.93
 ---
 # Wav2Vec2-Large-XLSR-53-Swedish
@@ -84,7 +93,7 @@ processor = Wav2Vec2Processor.from_pretrained("KBLab/wav2vec2-large-xlsr-53-swed
 model = Wav2Vec2ForCTC.from_pretrained("KBLab/wav2vec2-large-xlsr-53-swedish")
 model.to("cuda")
-chars_to_ignore_regex = '[,?.!\-;:"“]'
 resampler = torchaudio.transforms.Resample(48_000, 16_000)
 # Preprocessing the datasets.

 ---
+language: sv-SE
+datasets:
+- common_voice
+- NST Swedish ASR Database
+metrics:
+- wer
+- cer
 tags:
 - audio
 - automatic-speech-recognition
     dataset:
       name: Common Voice sv-SE
       type: common_voice
+      args: sv-SE
     metrics:
        - name: Test WER
          type: wer
+         value: 18.252392
+       - name: Test CER
+         type: cer
+         value: 5.965446
 ---
 # Wav2Vec2-Large-XLSR-53-Swedish
 model = Wav2Vec2ForCTC.from_pretrained("KBLab/wav2vec2-large-xlsr-53-swedish")
 model.to("cuda")
+chars_to_ignore_regex = '[,?.!\\-;:"“]'
 resampler = torchaudio.transforms.Resample(48_000, 16_000)
 # Preprocessing the datasets.