darkproger
/

pruned-transducer-stateless5-ukrainian-1-causal

Automatic Speech Recognition

Model card Files Files and versions Community

pruned-transducer-stateless5-ukrainian-1-causal / README.md

Volodymyr Kyrylov

initial import

0433008 about 2 years ago

|

1.63 kB

	---
	language:
	- uk
	tags:
	- automatic-speech-recognition
	- audio
	license: cc-by-nc-sa-4.0
	datasets:
	- https://github.com/egorsmkv/speech-recognition-uk
	- mozilla-foundation/common_voice_10_0
	metrics:
	- wer
	model-index:
	- name: Ukrainian causal pruned_transducer_stateless5 v1.0.0
	results:
	- task:
	name: Speech Recognition
	type: automatic-speech-recognition
	dataset:
	name: Common Voice uk
	type: mozilla-foundation/common_voice_10_0
	split: validation
	args: uk
	metrics:
	- name: Validation WER
	type: wer
	value: 17.26
	---

	Online variant of `pruned_transducer_stateless5` for Ukrainian: https://github.com/proger/icefall/tree/uk

	Decoding demo using [Sherpa](https://k2-fsa.github.io/sherpa/): [https://twitter.com/darkproger/status/1570733844114046976](https://twitter.com/darkproger/status/1570733844114046976)

	Trained on pseudolabels generated by [darkproger/pruned-transducer-stateless5-ukrainian-1](https://huggingface.co/darkproger/pruned-transducer-stateless5-ukrainian-1) on the training dataset.

	[Tensorboard run](https://tensorboard.dev/experiment/uMmMmZvwS2euyCrj7BlPOQ/)


	```
	./pruned_transducer_stateless5/train.py \
	--world-size 2 \
	--num-epochs 31 \
	--start-epoch 1 \
	--full-libri 1 \
	--exp-dir pruned_transducer_stateless5/exp-uk-filtered2 \
	--max-duration 600 \
	--use-fp16 1 \
	--num-encoder-layers 18 \
	--dim-feedforward 1024 \
	--nhead 4 \
	--encoder-dim 256 \
	--decoder-dim 512 \
	--joiner-dim 512 \
	--bpe-model uk/data/lang_bpe_250/bpe.model \
	--causal-convolution True \
	--dynamic-chunk-training True
	```