nrshoudi
/

wav2vec_arabic_mdd

@@ -17,9 +17,9 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [facebook/wav2vec2-xls-r-300m](https://huggingface.co/facebook/wav2vec2-xls-r-300m) on an unknown dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.3264
-- Wer: 0.0417
-- Per: 0.0321
 ## Model description
@@ -51,26 +51,26 @@ The following hyperparameters were used during training:
 | Training Loss | Epoch | Step  | Validation Loss | Wer    | Per    |
 |:-------------:|:-----:|:-----:|:---------------:|:------:|:------:|
-| 8.2138        | 1.0   | 1617  | 3.1149          | 1.0    | 1.0    |
-| 1.1507        | 2.0   | 3234  | 0.3763          | 0.0733 | 0.0570 |
-| 0.2           | 3.0   | 4851  | 0.3199          | 0.0634 | 0.0493 |
-| 0.1328        | 4.0   | 6468  | 0.3447          | 0.0530 | 0.0399 |
-| 0.1045        | 5.0   | 8085  | 0.3005          | 0.0514 | 0.0401 |
-| 0.088         | 6.0   | 9702  | 0.3276          | 0.0517 | 0.0391 |
-| 0.0756        | 7.0   | 11319 | 0.3367          | 0.0512 | 0.0388 |
-| 0.062         | 8.0   | 12936 | 0.3933          | 0.0572 | 0.0422 |
-| 0.0603        | 9.0   | 14553 | 0.3331          | 0.0475 | 0.0359 |
-| 0.0517        | 10.0  | 16170 | 0.3014          | 0.0500 | 0.0372 |
-| 0.046         | 11.0  | 17787 | 0.3067          | 0.0477 | 0.0360 |
-| 0.0398        | 12.0  | 19404 | 0.2990          | 0.0456 | 0.0348 |
-| 0.0329        | 13.0  | 21021 | 0.3064          | 0.0450 | 0.0342 |
-| 0.0319        | 14.0  | 22638 | 0.3336          | 0.0499 | 0.0383 |
-| 0.0288        | 15.0  | 24255 | 0.3222          | 0.0451 | 0.0358 |
-| 0.0258        | 16.0  | 25872 | 0.3302          | 0.0428 | 0.0324 |
-| 0.0181        | 17.0  | 27489 | 0.3408          | 0.0433 | 0.0334 |
-| 0.0172        | 18.0  | 29106 | 0.3216          | 0.0430 | 0.0331 |
-| 0.0145        | 19.0  | 30723 | 0.3254          | 0.0430 | 0.0329 |
-| 0.0127        | 20.0  | 32340 | 0.3264          | 0.0417 | 0.0321 |
 ### Framework versions

 This model is a fine-tuned version of [facebook/wav2vec2-xls-r-300m](https://huggingface.co/facebook/wav2vec2-xls-r-300m) on an unknown dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.3192
+- Wer: 0.0429
+- Per: 0.0326
 ## Model description
 | Training Loss | Epoch | Step  | Validation Loss | Wer    | Per    |
 |:-------------:|:-----:|:-----:|:---------------:|:------:|:------:|
+| 8.6256        | 1.0   | 1617  | 3.2158          | 1.0    | 1.0    |
+| 1.3467        | 2.0   | 3234  | 0.3775          | 0.0753 | 0.0605 |
+| 0.1996        | 3.0   | 4851  | 0.3054          | 0.0561 | 0.0421 |
+| 0.1311        | 4.0   | 6468  | 0.3120          | 0.0507 | 0.0387 |
+| 0.1044        | 5.0   | 8085  | 0.3169          | 0.0507 | 0.0386 |
+| 0.0891        | 6.0   | 9702  | 0.3030          | 0.0496 | 0.0372 |
+| 0.0788        | 7.0   | 11319 | 0.3174          | 0.0520 | 0.0391 |
+| 0.0619        | 8.0   | 12936 | 0.3312          | 0.0546 | 0.0417 |
+| 0.0552        | 9.0   | 14553 | 0.3353          | 0.0480 | 0.0358 |
+| 0.0493        | 10.0  | 16170 | 0.2742          | 0.0452 | 0.0336 |
+| 0.0417        | 11.0  | 17787 | 0.2894          | 0.0459 | 0.0355 |
+| 0.0382        | 12.0  | 19404 | 0.2949          | 0.0463 | 0.0350 |
+| 0.0306        | 13.0  | 21021 | 0.3041          | 0.0472 | 0.0348 |
+| 0.03          | 14.0  | 22638 | 0.3109          | 0.0453 | 0.0339 |
+| 0.0244        | 15.0  | 24255 | 0.3234          | 0.0448 | 0.0335 |
+| 0.0215        | 16.0  | 25872 | 0.3321          | 0.0436 | 0.0332 |
+| 0.0182        | 17.0  | 27489 | 0.3367          | 0.0420 | 0.0315 |
+| 0.0171        | 18.0  | 29106 | 0.3317          | 0.0430 | 0.0328 |
+| 0.0155        | 19.0  | 30723 | 0.3249          | 0.0423 | 0.0321 |
+| 0.0132        | 20.0  | 32340 | 0.3192          | 0.0429 | 0.0326 |
 ### Framework versions

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:29fe62faf88173276e1072187f5f576f7c13533622f9219344bfbaa4171491a9
 size 1262066346

 version https://git-lfs.github.com/spec/v1
+oid sha256:d40387ddacca81291f2327e4d9f5fded1e572861e24264c59d83ba8f1a49dec0
 size 1262066346

trainer_state.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
-  "best_metric": 0.29899266362190247,
-  "best_model_checkpoint": "nrshoudi/wav2vec_arabic_mdd/checkpoint-19404",
   "epoch": 20.0,
   "eval_steps": 500,
   "global_step": 32340,
@@ -11,331 +11,331 @@
     {
       "epoch": 1.0,
       "learning_rate": 5e-05,
-      "loss": 8.2138,
       "step": 1617
     },
     {
       "epoch": 1.0,
-      "eval_loss": 3.1148788928985596,
       "eval_per": 1.0,
-      "eval_runtime": 115.2576,
-      "eval_samples_per_second": 7.054,
-      "eval_steps_per_second": 3.531,
       "eval_wer": 1.0,
       "step": 1617
     },
     {
       "epoch": 2.0,
       "learning_rate": 0.0001,
-      "loss": 1.1507,
       "step": 3234
     },
     {
       "epoch": 2.0,
-      "eval_loss": 0.37626245617866516,
-      "eval_per": 0.0569820032036182,
-      "eval_runtime": 116.2275,
-      "eval_samples_per_second": 6.995,
-      "eval_steps_per_second": 3.502,
-      "eval_wer": 0.0732583640520741,
       "step": 3234
     },
     {
       "epoch": 3.0,
       "learning_rate": 9.444444444444444e-05,
-      "loss": 0.2,
       "step": 4851
     },
     {
       "epoch": 3.0,
-      "eval_loss": 0.319857656955719,
-      "eval_per": 0.04925562988787336,
-      "eval_runtime": 115.4027,
-      "eval_samples_per_second": 7.045,
-      "eval_steps_per_second": 3.527,
-      "eval_wer": 0.06341281321450236,
       "step": 4851
     },
     {
       "epoch": 4.0,
       "learning_rate": 8.888888888888889e-05,
-      "loss": 0.1328,
       "step": 6468
     },
     {
       "epoch": 4.0,
-      "eval_loss": 0.34467777609825134,
-      "eval_per": 0.03985677942146424,
-      "eval_runtime": 115.3838,
-      "eval_samples_per_second": 7.046,
-      "eval_steps_per_second": 3.527,
-      "eval_wer": 0.05296066445802809,
       "step": 6468
     },
     {
       "epoch": 5.0,
       "learning_rate": 8.333333333333334e-05,
-      "loss": 0.1045,
       "step": 8085
     },
     {
       "epoch": 5.0,
-      "eval_loss": 0.30046939849853516,
-      "eval_per": 0.04013945161594271,
-      "eval_runtime": 116.1796,
-      "eval_samples_per_second": 6.998,
-      "eval_steps_per_second": 3.503,
-      "eval_wer": 0.05142083897158322,
       "step": 8085
     },
     {
       "epoch": 6.0,
       "learning_rate": 7.777777777777778e-05,
-      "loss": 0.088,
       "step": 9702
     },
     {
       "epoch": 6.0,
-      "eval_loss": 0.32756975293159485,
-      "eval_per": 0.03907943088664845,
-      "eval_runtime": 116.0861,
-      "eval_samples_per_second": 7.003,
-      "eval_steps_per_second": 3.506,
-      "eval_wer": 0.05165414586346881,
       "step": 9702
     },
     {
       "epoch": 7.0,
       "learning_rate": 7.222222222222222e-05,
-      "loss": 0.0756,
       "step": 11319
     },
     {
       "epoch": 7.0,
-      "eval_loss": 0.33674493432044983,
-      "eval_per": 0.03879675869216998,
-      "eval_runtime": 115.7009,
-      "eval_samples_per_second": 7.027,
-      "eval_steps_per_second": 3.518,
-      "eval_wer": 0.05118753207969763,
       "step": 11319
     },
     {
       "epoch": 8.0,
       "learning_rate": 6.666666666666667e-05,
-      "loss": 0.062,
       "step": 12936
     },
     {
       "epoch": 8.0,
-      "eval_loss": 0.3933280110359192,
-      "eval_per": 0.042165269009705075,
-      "eval_runtime": 115.0602,
-      "eval_samples_per_second": 7.066,
-      "eval_steps_per_second": 3.537,
-      "eval_wer": 0.05720684989034576,
       "step": 12936
     },
     {
       "epoch": 9.0,
       "learning_rate": 6.111111111111112e-05,
-      "loss": 0.0603,
       "step": 14553
     },
     {
       "epoch": 9.0,
-      "eval_loss": 0.3331439197063446,
-      "eval_per": 0.03587581268255913,
-      "eval_runtime": 115.3081,
-      "eval_samples_per_second": 7.051,
-      "eval_steps_per_second": 3.53,
-      "eval_wer": 0.04754794456628249,
       "step": 14553
     },
     {
       "epoch": 10.0,
       "learning_rate": 5.555555555555556e-05,
-      "loss": 0.0517,
       "step": 16170
     },
     {
       "epoch": 10.0,
-      "eval_loss": 0.301434725522995,
-      "eval_per": 0.03717139357391878,
-      "eval_runtime": 115.3305,
-      "eval_samples_per_second": 7.049,
-      "eval_steps_per_second": 3.529,
-      "eval_wer": 0.049974336241892583,
       "step": 16170
     },
     {
       "epoch": 11.0,
       "learning_rate": 5e-05,
-      "loss": 0.046,
       "step": 17787
     },
     {
       "epoch": 11.0,
-      "eval_loss": 0.30668768286705017,
-      "eval_per": 0.036017148779798364,
-      "eval_runtime": 115.2426,
-      "eval_samples_per_second": 7.055,
-      "eval_steps_per_second": 3.532,
-      "eval_wer": 0.04768792870141384,
       "step": 17787
     },
     {
       "epoch": 12.0,
       "learning_rate": 4.4444444444444447e-05,
-      "loss": 0.0398,
       "step": 19404
     },
     {
       "epoch": 12.0,
-      "eval_loss": 0.29899266362190247,
-      "eval_per": 0.03481579195326486,
-      "eval_runtime": 115.6042,
-      "eval_samples_per_second": 7.033,
-      "eval_steps_per_second": 3.521,
-      "eval_wer": 0.04558816667444356,
       "step": 19404
     },
     {
       "epoch": 13.0,
       "learning_rate": 3.888888888888889e-05,
-      "loss": 0.0329,
       "step": 21021
     },
     {
       "epoch": 13.0,
-      "eval_loss": 0.3064207434654236,
-      "eval_per": 0.034226891548101386,
-      "eval_runtime": 116.0675,
-      "eval_samples_per_second": 7.005,
-      "eval_steps_per_second": 3.507,
-      "eval_wer": 0.04498156875554104,
       "step": 21021
     },
     {
       "epoch": 14.0,
       "learning_rate": 3.3333333333333335e-05,
-      "loss": 0.0319,
       "step": 22638
     },
     {
       "epoch": 14.0,
-      "eval_loss": 0.3336479663848877,
-      "eval_per": 0.03825497031941958,
-      "eval_runtime": 115.1932,
-      "eval_samples_per_second": 7.058,
-      "eval_steps_per_second": 3.533,
-      "eval_wer": 0.04988101348513835,
       "step": 22638
     },
     {
       "epoch": 15.0,
       "learning_rate": 2.777777777777778e-05,
-      "loss": 0.0288,
       "step": 24255
     },
     {
       "epoch": 15.0,
-      "eval_loss": 0.32215777039527893,
-      "eval_per": 0.03575803260152643,
-      "eval_runtime": 115.0522,
-      "eval_samples_per_second": 7.066,
-      "eval_steps_per_second": 3.538,
-      "eval_wer": 0.04512155289067239,
       "step": 24255
     },
     {
       "epoch": 16.0,
       "learning_rate": 2.2222222222222223e-05,
-      "loss": 0.0258,
       "step": 25872
     },
     {
       "epoch": 16.0,
-      "eval_loss": 0.33019357919692993,
-      "eval_per": 0.03241307830019787,
-      "eval_runtime": 115.355,
-      "eval_samples_per_second": 7.048,
-      "eval_steps_per_second": 3.528,
-      "eval_wer": 0.042788483971816525,
       "step": 25872
     },
     {
       "epoch": 17.0,
       "learning_rate": 1.6666666666666667e-05,
-      "loss": 0.0181,
       "step": 27489
     },
     {
       "epoch": 17.0,
-      "eval_loss": 0.3408127427101135,
-      "eval_per": 0.03335531894845944,
-      "eval_runtime": 115.3097,
-      "eval_samples_per_second": 7.051,
-      "eval_steps_per_second": 3.53,
-      "eval_wer": 0.0432550977555877,
       "step": 27489
     },
     {
       "epoch": 18.0,
       "learning_rate": 1.1111111111111112e-05,
-      "loss": 0.0172,
       "step": 29106
     },
     {
       "epoch": 18.0,
-      "eval_loss": 0.3215967118740082,
-      "eval_per": 0.033119758786394046,
-      "eval_runtime": 115.4137,
-      "eval_samples_per_second": 7.044,
-      "eval_steps_per_second": 3.526,
       "eval_wer": 0.043021790863702114,
       "step": 29106
     },
     {
       "epoch": 19.0,
       "learning_rate": 5.555555555555556e-06,
-      "loss": 0.0145,
       "step": 30723
     },
     {
       "epoch": 19.0,
-      "eval_loss": 0.3254193663597107,
-      "eval_per": 0.03293131065674173,
-      "eval_runtime": 115.2743,
-      "eval_samples_per_second": 7.053,
-      "eval_steps_per_second": 3.531,
-      "eval_wer": 0.042975129485324996,
       "step": 30723
     },
     {
       "epoch": 20.0,
       "learning_rate": 0.0,
-      "loss": 0.0127,
       "step": 32340
     },
     {
       "epoch": 20.0,
-      "eval_loss": 0.32637345790863037,
-      "eval_per": 0.0321304061057194,
-      "eval_runtime": 115.2538,
-      "eval_samples_per_second": 7.054,
-      "eval_steps_per_second": 3.531,
-      "eval_wer": 0.04166861089076571,
       "step": 32340
     },
     {
       "epoch": 20.0,
       "step": 32340,
       "total_flos": 1.0355998175044045e+19,
-      "train_loss": 0.520349072083029,
-      "train_runtime": 19017.9936,
-      "train_samples_per_second": 3.401,
-      "train_steps_per_second": 1.7
     }
   ],
   "logging_steps": 500,

 {
+  "best_metric": 0.2741861045360565,
+  "best_model_checkpoint": "nrshoudi/wav2vec_arabic_mdd/checkpoint-16170",
   "epoch": 20.0,
   "eval_steps": 500,
   "global_step": 32340,
     {
       "epoch": 1.0,
       "learning_rate": 5e-05,
+      "loss": 8.6256,
       "step": 1617
     },
     {
       "epoch": 1.0,
+      "eval_loss": 3.215786933898926,
       "eval_per": 1.0,
+      "eval_runtime": 116.0176,
+      "eval_samples_per_second": 7.008,
+      "eval_steps_per_second": 3.508,
       "eval_wer": 1.0,
       "step": 1617
     },
     {
       "epoch": 2.0,
       "learning_rate": 0.0001,
+      "loss": 1.3467,
       "step": 3234
     },
     {
       "epoch": 2.0,
+      "eval_loss": 0.37750244140625,
+      "eval_per": 0.060468293602185995,
+      "eval_runtime": 116.9742,
+      "eval_samples_per_second": 6.95,
+      "eval_steps_per_second": 3.479,
+      "eval_wer": 0.07531146470066725,
       "step": 3234
     },
     {
       "epoch": 3.0,
       "learning_rate": 9.444444444444444e-05,
+      "loss": 0.1996,
       "step": 4851
     },
     {
       "epoch": 3.0,
+      "eval_loss": 0.30538317561149597,
+      "eval_per": 0.042094600961085464,
+      "eval_runtime": 117.0156,
+      "eval_samples_per_second": 6.948,
+      "eval_steps_per_second": 3.478,
+      "eval_wer": 0.056133638187672065,
       "step": 4851
     },
     {
       "epoch": 4.0,
       "learning_rate": 8.888888888888889e-05,
+      "loss": 0.1311,
       "step": 6468
     },
     {
       "epoch": 4.0,
+      "eval_loss": 0.31199753284454346,
+      "eval_per": 0.038655422594930745,
+      "eval_runtime": 116.6027,
+      "eval_samples_per_second": 6.972,
+      "eval_steps_per_second": 3.49,
+      "eval_wer": 0.05067425691754934,
       "step": 6468
     },
     {
       "epoch": 5.0,
       "learning_rate": 8.333333333333334e-05,
+      "loss": 0.1044,
       "step": 8085
     },
     {
       "epoch": 5.0,
+      "eval_loss": 0.31690752506256104,
+      "eval_per": 0.038608310562517664,
+      "eval_runtime": 118.0869,
+      "eval_samples_per_second": 6.885,
+      "eval_steps_per_second": 3.447,
+      "eval_wer": 0.05072091829592646,
       "step": 8085
     },
     {
       "epoch": 6.0,
       "learning_rate": 7.777777777777778e-05,
+      "loss": 0.0891,
       "step": 9702
     },
     {
       "epoch": 6.0,
+      "eval_loss": 0.30304601788520813,
+      "eval_per": 0.03721850560633186,
+      "eval_runtime": 118.602,
+      "eval_samples_per_second": 6.855,
+      "eval_steps_per_second": 3.432,
+      "eval_wer": 0.04960104521487565,
       "step": 9702
     },
     {
       "epoch": 7.0,
       "learning_rate": 7.222222222222222e-05,
+      "loss": 0.0788,
       "step": 11319
     },
     {
       "epoch": 7.0,
+      "eval_loss": 0.31736186146736145,
+      "eval_per": 0.03910298690285499,
+      "eval_runtime": 118.2233,
+      "eval_samples_per_second": 6.877,
+      "eval_steps_per_second": 3.443,
+      "eval_wer": 0.052027436890485744,
       "step": 11319
     },
     {
       "epoch": 8.0,
       "learning_rate": 6.666666666666667e-05,
+      "loss": 0.0619,
       "step": 12936
     },
     {
       "epoch": 8.0,
+      "eval_loss": 0.33120226860046387,
+      "eval_per": 0.0416941486855743,
+      "eval_runtime": 118.3706,
+      "eval_samples_per_second": 6.868,
+      "eval_steps_per_second": 3.438,
+      "eval_wer": 0.05459381270122719,
       "step": 12936
     },
     {
       "epoch": 9.0,
       "learning_rate": 6.111111111111112e-05,
+      "loss": 0.0552,
       "step": 14553
     },
     {
       "epoch": 9.0,
+      "eval_loss": 0.3352554142475128,
+      "eval_per": 0.03575803260152643,
+      "eval_runtime": 119.3222,
+      "eval_samples_per_second": 6.813,
+      "eval_steps_per_second": 3.411,
+      "eval_wer": 0.04796789697167654,
       "step": 14553
     },
     {
       "epoch": 10.0,
       "learning_rate": 5.555555555555556e-05,
+      "loss": 0.0493,
       "step": 16170
     },
     {
       "epoch": 10.0,
+      "eval_loss": 0.2741861045360565,
+      "eval_per": 0.033567323094318285,
+      "eval_runtime": 119.9093,
+      "eval_samples_per_second": 6.78,
+      "eval_steps_per_second": 3.394,
+      "eval_wer": 0.04521487564742663,
       "step": 16170
     },
     {
       "epoch": 11.0,
       "learning_rate": 5e-05,
+      "loss": 0.0417,
       "step": 17787
     },
     {
       "epoch": 11.0,
+      "eval_loss": 0.28943416476249695,
+      "eval_per": 0.03547536040704796,
+      "eval_runtime": 120.1333,
+      "eval_samples_per_second": 6.767,
+      "eval_steps_per_second": 3.388,
+      "eval_wer": 0.04586813494470627,
       "step": 17787
     },
     {
       "epoch": 12.0,
       "learning_rate": 4.4444444444444447e-05,
+      "loss": 0.0382,
       "step": 19404
     },
     {
       "epoch": 12.0,
+      "eval_loss": 0.29486820101737976,
+      "eval_per": 0.03500424008291718,
+      "eval_runtime": 119.6619,
+      "eval_samples_per_second": 6.794,
+      "eval_steps_per_second": 3.401,
+      "eval_wer": 0.04633474872847744,
       "step": 19404
     },
     {
       "epoch": 13.0,
       "learning_rate": 3.888888888888889e-05,
+      "loss": 0.0306,
       "step": 21021
     },
     {
       "epoch": 13.0,
+      "eval_loss": 0.30409368872642517,
+      "eval_per": 0.034792235937058325,
+      "eval_runtime": 120.2788,
+      "eval_samples_per_second": 6.759,
+      "eval_steps_per_second": 3.384,
+      "eval_wer": 0.04717465353926555,
       "step": 21021
     },
     {
       "epoch": 14.0,
       "learning_rate": 3.3333333333333335e-05,
+      "loss": 0.03,
       "step": 22638
     },
     {
       "epoch": 14.0,
+      "eval_loss": 0.3109176456928253,
+      "eval_per": 0.033920663337416376,
+      "eval_runtime": 118.5483,
+      "eval_samples_per_second": 6.858,
+      "eval_steps_per_second": 3.433,
+      "eval_wer": 0.045261537025803746,
       "step": 22638
     },
     {
       "epoch": 15.0,
       "learning_rate": 2.777777777777778e-05,
+      "loss": 0.0244,
       "step": 24255
     },
     {
       "epoch": 15.0,
+      "eval_loss": 0.3234339952468872,
+      "eval_per": 0.03347309902949213,
+      "eval_runtime": 118.5882,
+      "eval_samples_per_second": 6.856,
+      "eval_steps_per_second": 3.432,
+      "eval_wer": 0.044841584620409686,
       "step": 24255
     },
     {
       "epoch": 16.0,
       "learning_rate": 2.2222222222222223e-05,
+      "loss": 0.0215,
       "step": 25872
     },
     {
       "epoch": 16.0,
+      "eval_loss": 0.33212560415267944,
+      "eval_per": 0.03316687081880712,
+      "eval_runtime": 118.6022,
+      "eval_samples_per_second": 6.855,
+      "eval_steps_per_second": 3.432,
+      "eval_wer": 0.04362838878260464,
       "step": 25872
     },
     {
       "epoch": 17.0,
       "learning_rate": 1.6666666666666667e-05,
+      "loss": 0.0182,
       "step": 27489
     },
     {
       "epoch": 17.0,
+      "eval_loss": 0.3367431163787842,
+      "eval_per": 0.03154150570055592,
+      "eval_runtime": 118.0708,
+      "eval_samples_per_second": 6.886,
+      "eval_steps_per_second": 3.447,
+      "eval_wer": 0.04204190191778265,
       "step": 27489
     },
     {
       "epoch": 18.0,
       "learning_rate": 1.1111111111111112e-05,
+      "loss": 0.0171,
       "step": 29106
     },
     {
       "epoch": 18.0,
+      "eval_loss": 0.3317033350467682,
+      "eval_per": 0.032766418543295955,
+      "eval_runtime": 117.8323,
+      "eval_samples_per_second": 6.9,
+      "eval_steps_per_second": 3.454,
       "eval_wer": 0.043021790863702114,
       "step": 29106
     },
     {
       "epoch": 19.0,
       "learning_rate": 5.555555555555556e-06,
+      "loss": 0.0155,
       "step": 30723
     },
     {
       "epoch": 19.0,
+      "eval_loss": 0.3248533606529236,
+      "eval_per": 0.03210685008951286,
+      "eval_runtime": 118.4543,
+      "eval_samples_per_second": 6.863,
+      "eval_steps_per_second": 3.436,
+      "eval_wer": 0.04227520880966824,
       "step": 30723
     },
     {
       "epoch": 20.0,
       "learning_rate": 0.0,
+      "loss": 0.0132,
       "step": 32340
     },
     {
       "epoch": 20.0,
+      "eval_loss": 0.31921908259391785,
+      "eval_per": 0.032577970413643645,
+      "eval_runtime": 118.1674,
+      "eval_samples_per_second": 6.88,
+      "eval_steps_per_second": 3.444,
+      "eval_wer": 0.04292846810694788,
       "step": 32340
     },
     {
       "epoch": 20.0,
       "step": 32340,
       "total_flos": 1.0355998175044045e+19,
+      "train_loss": 0.54961431122298,
+      "train_runtime": 19355.5909,
+      "train_samples_per_second": 3.342,
+      "train_steps_per_second": 1.671
     }
   ],
   "logging_steps": 500,