End of training

Browse files

Files changed (6) hide show

README.md +81 -0
config.json +109 -0
preprocessor_config.json +10 -0
pytorch_model.bin +3 -0
trainer_state.json +348 -0
training_args.bin +3 -0

README.md ADDED Viewed

	@@ -0,0 +1,81 @@

+---
+license: apache-2.0
+base_model: facebook/wav2vec2-xls-r-300m
+tags:
+- generated_from_trainer
+metrics:
+- wer
+model-index:
+- name: wav2vec_arabic_mdd
+  results: []
+---
+<!-- This model card has been generated automatically according to the information the Trainer had access to. You
+should probably proofread and complete it, then remove this comment. -->
+# wav2vec_arabic_mdd
+This model is a fine-tuned version of [facebook/wav2vec2-xls-r-300m](https://huggingface.co/facebook/wav2vec2-xls-r-300m) on an unknown dataset.
+It achieves the following results on the evaluation set:
+- Loss: 0.3264
+- Wer: 0.0417
+- Per: 0.0321
+## Model description
+More information needed
+## Intended uses & limitations
+More information needed
+## Training and evaluation data
+More information needed
+## Training procedure
+### Training hyperparameters
+The following hyperparameters were used during training:
+- learning_rate: 0.0001
+- train_batch_size: 2
+- eval_batch_size: 2
+- seed: 42
+- optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
+- lr_scheduler_type: linear
+- lr_scheduler_warmup_ratio: 0.1
+- num_epochs: 20
+### Training results
+| Training Loss | Epoch | Step  | Validation Loss | Wer    | Per    |
+|:-------------:|:-----:|:-----:|:---------------:|:------:|:------:|
+| 8.2138        | 1.0   | 1617  | 3.1149          | 1.0    | 1.0    |
+| 1.1507        | 2.0   | 3234  | 0.3763          | 0.0733 | 0.0570 |
+| 0.2           | 3.0   | 4851  | 0.3199          | 0.0634 | 0.0493 |
+| 0.1328        | 4.0   | 6468  | 0.3447          | 0.0530 | 0.0399 |
+| 0.1045        | 5.0   | 8085  | 0.3005          | 0.0514 | 0.0401 |
+| 0.088         | 6.0   | 9702  | 0.3276          | 0.0517 | 0.0391 |
+| 0.0756        | 7.0   | 11319 | 0.3367          | 0.0512 | 0.0388 |
+| 0.062         | 8.0   | 12936 | 0.3933          | 0.0572 | 0.0422 |
+| 0.0603        | 9.0   | 14553 | 0.3331          | 0.0475 | 0.0359 |
+| 0.0517        | 10.0  | 16170 | 0.3014          | 0.0500 | 0.0372 |
+| 0.046         | 11.0  | 17787 | 0.3067          | 0.0477 | 0.0360 |
+| 0.0398        | 12.0  | 19404 | 0.2990          | 0.0456 | 0.0348 |
+| 0.0329        | 13.0  | 21021 | 0.3064          | 0.0450 | 0.0342 |
+| 0.0319        | 14.0  | 22638 | 0.3336          | 0.0499 | 0.0383 |
+| 0.0288        | 15.0  | 24255 | 0.3222          | 0.0451 | 0.0358 |
+| 0.0258        | 16.0  | 25872 | 0.3302          | 0.0428 | 0.0324 |
+| 0.0181        | 17.0  | 27489 | 0.3408          | 0.0433 | 0.0334 |
+| 0.0172        | 18.0  | 29106 | 0.3216          | 0.0430 | 0.0331 |
+| 0.0145        | 19.0  | 30723 | 0.3254          | 0.0430 | 0.0329 |
+| 0.0127        | 20.0  | 32340 | 0.3264          | 0.0417 | 0.0321 |
+### Framework versions
+- Transformers 4.34.1
+- Pytorch 2.1.0+cu118
+- Datasets 2.14.6
+- Tokenizers 0.14.1

config.json ADDED Viewed

	@@ -0,0 +1,109 @@

+{
+  "_name_or_path": "facebook/wav2vec2-xls-r-300m",
+  "activation_dropout": 0.0,
+  "adapter_attn_dim": null,
+  "adapter_kernel_size": 3,
+  "adapter_stride": 2,
+  "add_adapter": false,
+  "apply_spec_augment": true,
+  "architectures": [
+    "Wav2Vec2ForCTC"
+  ],
+  "attention_dropout": 0.1,
+  "bos_token_id": 1,
+  "classifier_proj_size": 256,
+  "codevector_dim": 768,
+  "contrastive_logits_temperature": 0.1,
+  "conv_bias": true,
+  "conv_dim": [
+    512,
+    512,
+    512,
+    512,
+    512,
+    512,
+    512
+  ],
+  "conv_kernel": [
+    10,
+    3,
+    3,
+    3,
+    3,
+    2,
+    2
+  ],
+  "conv_stride": [
+    5,
+    2,
+    2,
+    2,
+    2,
+    2,
+    2
+  ],
+  "ctc_loss_reduction": "mean",
+  "ctc_zero_infinity": false,
+  "diversity_loss_weight": 0.1,
+  "do_stable_layer_norm": true,
+  "eos_token_id": 2,
+  "feat_extract_activation": "gelu",
+  "feat_extract_dropout": 0.0,
+  "feat_extract_norm": "layer",
+  "feat_proj_dropout": 0.1,
+  "feat_quantizer_dropout": 0.0,
+  "final_dropout": 0.0,
+  "gradient_checkpointing": false,
+  "hidden_act": "gelu",
+  "hidden_dropout": 0.1,
+  "hidden_size": 1024,
+  "initializer_range": 0.02,
+  "intermediate_size": 4096,
+  "layer_norm_eps": 1e-05,
+  "layerdrop": 0.1,
+  "mask_feature_length": 10,
+  "mask_feature_min_masks": 0,
+  "mask_feature_prob": 0.0,
+  "mask_time_length": 10,
+  "mask_time_min_masks": 2,
+  "mask_time_prob": 0.075,
+  "model_type": "wav2vec2",
+  "num_adapter_layers": 3,
+  "num_attention_heads": 16,
+  "num_codevector_groups": 2,
+  "num_codevectors_per_group": 320,
+  "num_conv_pos_embedding_groups": 16,
+  "num_conv_pos_embeddings": 128,
+  "num_feat_extract_layers": 7,
+  "num_hidden_layers": 24,
+  "num_negatives": 100,
+  "output_hidden_size": 1024,
+  "pad_token_id": 37,
+  "proj_codevector_dim": 768,
+  "tdnn_dilation": [
+    1,
+    2,
+    3,
+    1,
+    1
+  ],
+  "tdnn_dim": [
+    512,
+    512,
+    512,
+    512,
+    1500
+  ],
+  "tdnn_kernel": [
+    5,
+    3,
+    3,
+    1,
+    1
+  ],
+  "torch_dtype": "float32",
+  "transformers_version": "4.34.1",
+  "use_weighted_layer_sum": false,
+  "vocab_size": 40,
+  "xvector_output_dim": 512
+}

preprocessor_config.json ADDED Viewed

	@@ -0,0 +1,10 @@

+{
+  "do_normalize": true,
+  "feature_extractor_type": "Wav2Vec2FeatureExtractor",
+  "feature_size": 1,
+  "padding_side": "right",
+  "padding_value": 0,
+  "processor_class": "Wav2Vec2Processor",
+  "return_attention_mask": true,
+  "sampling_rate": 16000
+}

pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:29fe62faf88173276e1072187f5f576f7c13533622f9219344bfbaa4171491a9
+size 1262066346

trainer_state.json ADDED Viewed

	@@ -0,0 +1,348 @@

+{
+  "best_metric": 0.29899266362190247,
+  "best_model_checkpoint": "nrshoudi/wav2vec_arabic_mdd/checkpoint-19404",
+  "epoch": 20.0,
+  "eval_steps": 500,
+  "global_step": 32340,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 1.0,
+      "learning_rate": 5e-05,
+      "loss": 8.2138,
+      "step": 1617
+    },
+    {
+      "epoch": 1.0,
+      "eval_loss": 3.1148788928985596,
+      "eval_per": 1.0,
+      "eval_runtime": 115.2576,
+      "eval_samples_per_second": 7.054,
+      "eval_steps_per_second": 3.531,
+      "eval_wer": 1.0,
+      "step": 1617
+    },
+    {
+      "epoch": 2.0,
+      "learning_rate": 0.0001,
+      "loss": 1.1507,
+      "step": 3234
+    },
+    {
+      "epoch": 2.0,
+      "eval_loss": 0.37626245617866516,
+      "eval_per": 0.0569820032036182,
+      "eval_runtime": 116.2275,
+      "eval_samples_per_second": 6.995,
+      "eval_steps_per_second": 3.502,
+      "eval_wer": 0.0732583640520741,
+      "step": 3234
+    },
+    {
+      "epoch": 3.0,
+      "learning_rate": 9.444444444444444e-05,
+      "loss": 0.2,
+      "step": 4851
+    },
+    {
+      "epoch": 3.0,
+      "eval_loss": 0.319857656955719,
+      "eval_per": 0.04925562988787336,
+      "eval_runtime": 115.4027,
+      "eval_samples_per_second": 7.045,
+      "eval_steps_per_second": 3.527,
+      "eval_wer": 0.06341281321450236,
+      "step": 4851
+    },
+    {
+      "epoch": 4.0,
+      "learning_rate": 8.888888888888889e-05,
+      "loss": 0.1328,
+      "step": 6468
+    },
+    {
+      "epoch": 4.0,
+      "eval_loss": 0.34467777609825134,
+      "eval_per": 0.03985677942146424,
+      "eval_runtime": 115.3838,
+      "eval_samples_per_second": 7.046,
+      "eval_steps_per_second": 3.527,
+      "eval_wer": 0.05296066445802809,
+      "step": 6468
+    },
+    {
+      "epoch": 5.0,
+      "learning_rate": 8.333333333333334e-05,
+      "loss": 0.1045,
+      "step": 8085
+    },
+    {
+      "epoch": 5.0,
+      "eval_loss": 0.30046939849853516,
+      "eval_per": 0.04013945161594271,
+      "eval_runtime": 116.1796,
+      "eval_samples_per_second": 6.998,
+      "eval_steps_per_second": 3.503,
+      "eval_wer": 0.05142083897158322,
+      "step": 8085
+    },
+    {
+      "epoch": 6.0,
+      "learning_rate": 7.777777777777778e-05,
+      "loss": 0.088,
+      "step": 9702
+    },
+    {
+      "epoch": 6.0,
+      "eval_loss": 0.32756975293159485,
+      "eval_per": 0.03907943088664845,
+      "eval_runtime": 116.0861,
+      "eval_samples_per_second": 7.003,
+      "eval_steps_per_second": 3.506,
+      "eval_wer": 0.05165414586346881,
+      "step": 9702
+    },
+    {
+      "epoch": 7.0,
+      "learning_rate": 7.222222222222222e-05,
+      "loss": 0.0756,
+      "step": 11319
+    },
+    {
+      "epoch": 7.0,
+      "eval_loss": 0.33674493432044983,
+      "eval_per": 0.03879675869216998,
+      "eval_runtime": 115.7009,
+      "eval_samples_per_second": 7.027,
+      "eval_steps_per_second": 3.518,
+      "eval_wer": 0.05118753207969763,
+      "step": 11319
+    },
+    {
+      "epoch": 8.0,
+      "learning_rate": 6.666666666666667e-05,
+      "loss": 0.062,
+      "step": 12936
+    },
+    {
+      "epoch": 8.0,
+      "eval_loss": 0.3933280110359192,
+      "eval_per": 0.042165269009705075,
+      "eval_runtime": 115.0602,
+      "eval_samples_per_second": 7.066,
+      "eval_steps_per_second": 3.537,
+      "eval_wer": 0.05720684989034576,
+      "step": 12936
+    },
+    {
+      "epoch": 9.0,
+      "learning_rate": 6.111111111111112e-05,
+      "loss": 0.0603,
+      "step": 14553
+    },
+    {
+      "epoch": 9.0,
+      "eval_loss": 0.3331439197063446,
+      "eval_per": 0.03587581268255913,
+      "eval_runtime": 115.3081,
+      "eval_samples_per_second": 7.051,
+      "eval_steps_per_second": 3.53,
+      "eval_wer": 0.04754794456628249,
+      "step": 14553
+    },
+    {
+      "epoch": 10.0,
+      "learning_rate": 5.555555555555556e-05,
+      "loss": 0.0517,
+      "step": 16170
+    },
+    {
+      "epoch": 10.0,
+      "eval_loss": 0.301434725522995,
+      "eval_per": 0.03717139357391878,
+      "eval_runtime": 115.3305,
+      "eval_samples_per_second": 7.049,
+      "eval_steps_per_second": 3.529,
+      "eval_wer": 0.049974336241892583,
+      "step": 16170
+    },
+    {
+      "epoch": 11.0,
+      "learning_rate": 5e-05,
+      "loss": 0.046,
+      "step": 17787
+    },
+    {
+      "epoch": 11.0,
+      "eval_loss": 0.30668768286705017,
+      "eval_per": 0.036017148779798364,
+      "eval_runtime": 115.2426,
+      "eval_samples_per_second": 7.055,
+      "eval_steps_per_second": 3.532,
+      "eval_wer": 0.04768792870141384,
+      "step": 17787
+    },
+    {
+      "epoch": 12.0,
+      "learning_rate": 4.4444444444444447e-05,
+      "loss": 0.0398,
+      "step": 19404
+    },
+    {
+      "epoch": 12.0,
+      "eval_loss": 0.29899266362190247,
+      "eval_per": 0.03481579195326486,
+      "eval_runtime": 115.6042,
+      "eval_samples_per_second": 7.033,
+      "eval_steps_per_second": 3.521,
+      "eval_wer": 0.04558816667444356,
+      "step": 19404
+    },
+    {
+      "epoch": 13.0,
+      "learning_rate": 3.888888888888889e-05,
+      "loss": 0.0329,
+      "step": 21021
+    },
+    {
+      "epoch": 13.0,
+      "eval_loss": 0.3064207434654236,
+      "eval_per": 0.034226891548101386,
+      "eval_runtime": 116.0675,
+      "eval_samples_per_second": 7.005,
+      "eval_steps_per_second": 3.507,
+      "eval_wer": 0.04498156875554104,
+      "step": 21021
+    },
+    {
+      "epoch": 14.0,
+      "learning_rate": 3.3333333333333335e-05,
+      "loss": 0.0319,
+      "step": 22638
+    },
+    {
+      "epoch": 14.0,
+      "eval_loss": 0.3336479663848877,
+      "eval_per": 0.03825497031941958,
+      "eval_runtime": 115.1932,
+      "eval_samples_per_second": 7.058,
+      "eval_steps_per_second": 3.533,
+      "eval_wer": 0.04988101348513835,
+      "step": 22638
+    },
+    {
+      "epoch": 15.0,
+      "learning_rate": 2.777777777777778e-05,
+      "loss": 0.0288,
+      "step": 24255
+    },
+    {
+      "epoch": 15.0,
+      "eval_loss": 0.32215777039527893,
+      "eval_per": 0.03575803260152643,
+      "eval_runtime": 115.0522,
+      "eval_samples_per_second": 7.066,
+      "eval_steps_per_second": 3.538,
+      "eval_wer": 0.04512155289067239,
+      "step": 24255
+    },
+    {
+      "epoch": 16.0,
+      "learning_rate": 2.2222222222222223e-05,
+      "loss": 0.0258,
+      "step": 25872
+    },
+    {
+      "epoch": 16.0,
+      "eval_loss": 0.33019357919692993,
+      "eval_per": 0.03241307830019787,
+      "eval_runtime": 115.355,
+      "eval_samples_per_second": 7.048,
+      "eval_steps_per_second": 3.528,
+      "eval_wer": 0.042788483971816525,
+      "step": 25872
+    },
+    {
+      "epoch": 17.0,
+      "learning_rate": 1.6666666666666667e-05,
+      "loss": 0.0181,
+      "step": 27489
+    },
+    {
+      "epoch": 17.0,
+      "eval_loss": 0.3408127427101135,
+      "eval_per": 0.03335531894845944,
+      "eval_runtime": 115.3097,
+      "eval_samples_per_second": 7.051,
+      "eval_steps_per_second": 3.53,
+      "eval_wer": 0.0432550977555877,
+      "step": 27489
+    },
+    {
+      "epoch": 18.0,
+      "learning_rate": 1.1111111111111112e-05,
+      "loss": 0.0172,
+      "step": 29106
+    },
+    {
+      "epoch": 18.0,
+      "eval_loss": 0.3215967118740082,
+      "eval_per": 0.033119758786394046,
+      "eval_runtime": 115.4137,
+      "eval_samples_per_second": 7.044,
+      "eval_steps_per_second": 3.526,
+      "eval_wer": 0.043021790863702114,
+      "step": 29106
+    },
+    {
+      "epoch": 19.0,
+      "learning_rate": 5.555555555555556e-06,
+      "loss": 0.0145,
+      "step": 30723
+    },
+    {
+      "epoch": 19.0,
+      "eval_loss": 0.3254193663597107,
+      "eval_per": 0.03293131065674173,
+      "eval_runtime": 115.2743,
+      "eval_samples_per_second": 7.053,
+      "eval_steps_per_second": 3.531,
+      "eval_wer": 0.042975129485324996,
+      "step": 30723
+    },
+    {
+      "epoch": 20.0,
+      "learning_rate": 0.0,
+      "loss": 0.0127,
+      "step": 32340
+    },
+    {
+      "epoch": 20.0,
+      "eval_loss": 0.32637345790863037,
+      "eval_per": 0.0321304061057194,
+      "eval_runtime": 115.2538,
+      "eval_samples_per_second": 7.054,
+      "eval_steps_per_second": 3.531,
+      "eval_wer": 0.04166861089076571,
+      "step": 32340
+    },
+    {
+      "epoch": 20.0,
+      "step": 32340,
+      "total_flos": 1.0355998175044045e+19,
+      "train_loss": 0.520349072083029,
+      "train_runtime": 19017.9936,
+      "train_samples_per_second": 3.401,
+      "train_steps_per_second": 1.7
+    }
+  ],
+  "logging_steps": 500,
+  "max_steps": 32340,
+  "num_train_epochs": 20,
+  "save_steps": 500,
+  "total_flos": 1.0355998175044045e+19,
+  "trial_name": null,
+  "trial_params": null
+}

training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:84b4a7ac0e1c6b093474175c4fd5e8c724dc3907c9fb9bd69ef08bd309794b0d
+size 4536