Automatic Speech Recognition
ESPnet
audio
File size: 1,317 Bytes
963b103
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
<!-- Generated by scripts/utils/show_asr_result.sh -->
# RESULTS
## Environments
- date: `Thu Jan  2 23:57:27 CST 2025`
- python version: `3.10.15 (main, Oct  3 2024, 07:21:53) [GCC 11.2.0]`
- espnet version: `espnet 202409`
- pytorch version: `pytorch 2.6.0.dev20241008+cu124`
- Git hash: `18d7dea6677b7ff55a67e2be19cb748fb1c51d74`
  - Commit date: `Tue Dec 31 03:30:01 2024 +0000`

## exp/asr_train_asr_raw_char
### WER

|dataset|Snt|Wrd|Corr|Sub|Del|Ins|Err|S.Err|
|---|---|---|---|---|---|---|---|---|
|decode_asr_asr_model_valid.loss.ave/dev_dialect|7095|79456|31.0|63.0|5.9|5.3|74.2|99.8|

### CER

|dataset|Snt|Wrd|Corr|Sub|Del|Ins|Err|S.Err|
|---|---|---|---|---|---|---|---|---|
|decode_asr_asr_model_valid.loss.ave/dev_dialect|7095|460200|77.5|9.6|12.8|3.6|26.1|99.8|

### TER

|dataset|Snt|Wrd|Corr|Sub|Del|Ins|Err|S.Err|
|---|---|---|---|---|---|---|---|---|
## exp/asr_train_asr_raw_char/decode_asr_asr_model_valid.loss.ave
### WER

|dataset|Snt|Wrd|Corr|Sub|Del|Ins|Err|S.Err|
|---|---|---|---|---|---|---|---|---|
|org/dev|23892|237924|42.2|50.5|7.3|5.4|63.2|96.0|

### CER

|dataset|Snt|Wrd|Corr|Sub|Del|Ins|Err|S.Err|
|---|---|---|---|---|---|---|---|---|
|org/dev|23892|1514325|84.5|7.7|7.8|3.4|18.9|96.0|

### TER

|dataset|Snt|Wrd|Corr|Sub|Del|Ins|Err|S.Err|
|---|---|---|---|---|---|---|---|---|