End of training

Browse files

Files changed (7) hide show

all_results.json +15 -0
eval_results.json +10 -0
pytorch_model.bin +1 -1
runs/Feb03_04-53-30_job-976da207-1032-42b1-8e4b-195231e136ae/events.out.tfevents.1643865655.job-976da207-1032-42b1-8e4b-195231e136ae.14574.0 +2 -2
runs/Feb03_04-53-30_job-976da207-1032-42b1-8e4b-195231e136ae/events.out.tfevents.1644166682.job-976da207-1032-42b1-8e4b-195231e136ae.14574.2 +3 -0
train_results.json +8 -0
trainer_state.json +489 -0

all_results.json ADDED Viewed

	@@ -0,0 +1,15 @@

+{
+    "epoch": 100.0,
+    "eval_cer": 0.09914388076368318,
+    "eval_loss": 0.21041299402713776,
+    "eval_runtime": 208.9129,
+    "eval_samples": 3676,
+    "eval_samples_per_second": 17.596,
+    "eval_steps_per_second": 2.202,
+    "eval_wer": 0.19410805775500697,
+    "train_loss": 0.804292679347349,
+    "train_runtime": 300809.9995,
+    "train_samples": 28516,
+    "train_samples_per_second": 9.48,
+    "train_steps_per_second": 0.148
+}

eval_results.json ADDED Viewed

	@@ -0,0 +1,10 @@

+{
+    "epoch": 100.0,
+    "eval_cer": 0.09914388076368318,
+    "eval_loss": 0.21041299402713776,
+    "eval_runtime": 208.9129,
+    "eval_samples": 3676,
+    "eval_samples_per_second": 17.596,
+    "eval_steps_per_second": 2.202,
+    "eval_wer": 0.19410805775500697
+}

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:699b6967664875d97e73ee690d596268a4ec1e9705e1884e9007bda46339a861
 size 3850917361

 version https://git-lfs.github.com/spec/v1
+oid sha256:ff591920abac5e239f21736ff7b503ef79a6b6da127464ccc75632ad744aaa5f
 size 3850917361

runs/Feb03_04-53-30_job-976da207-1032-42b1-8e4b-195231e136ae/events.out.tfevents.1643865655.job-976da207-1032-42b1-8e4b-195231e136ae.14574.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:17ac1180dee395489e6988818cf5e4cbcda648fc5acadb6933bd59a19b2ff2db
-size 9473

 version https://git-lfs.github.com/spec/v1
+oid sha256:70690178dab1e011bf693d3d6068bc55dc63fb647eb9e8b5ae39fadb295e152f
+size 20463

runs/Feb03_04-53-30_job-976da207-1032-42b1-8e4b-195231e136ae/events.out.tfevents.1644166682.job-976da207-1032-42b1-8e4b-195231e136ae.14574.2 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:328e79b7e615805bf7d231b74b03d52078e449c3040e96ba4ef114d743b5507a
+size 412

train_results.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+    "epoch": 100.0,
+    "train_loss": 0.804292679347349,
+    "train_runtime": 300809.9995,
+    "train_samples": 28516,
+    "train_samples_per_second": 9.48,
+    "train_steps_per_second": 0.148
+}

trainer_state.json ADDED Viewed

	@@ -0,0 +1,489 @@

+{
+  "best_metric": 0.21041299402713776,
+  "best_model_checkpoint": "wav2vec2-xls-r-1b-ja-dumy8/checkpoint-42000",
+  "epoch": 99.99831744251262,
+  "global_step": 44500,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 3.37,
+      "learning_rate": 4.9427586206896555e-05,
+      "loss": 2.2896,
+      "step": 1500
+    },
+    {
+      "epoch": 3.37,
+      "eval_cer": 0.17672193185166804,
+      "eval_loss": 0.47477588057518005,
+      "eval_runtime": 210.4906,
+      "eval_samples_per_second": 17.464,
+      "eval_steps_per_second": 2.185,
+      "eval_wer": 0.4013274336283186,
+      "step": 1500
+    },
+    {
+      "epoch": 6.74,
+      "learning_rate": 4.770459770114943e-05,
+      "loss": 1.1608,
+      "step": 3000
+    },
+    {
+      "epoch": 6.74,
+      "eval_cer": 0.14555577958031546,
+      "eval_loss": 0.33504194021224976,
+      "eval_runtime": 209.7295,
+      "eval_samples_per_second": 17.527,
+      "eval_steps_per_second": 2.193,
+      "eval_wer": 0.315929203539823,
+      "step": 3000
+    },
+    {
+      "epoch": 10.11,
+      "learning_rate": 4.598045977011494e-05,
+      "loss": 1.1042,
+      "step": 4500
+    },
+    {
+      "epoch": 10.11,
+      "eval_cer": 0.1399956573661926,
+      "eval_loss": 0.31194448471069336,
+      "eval_runtime": 210.0423,
+      "eval_samples_per_second": 17.501,
+      "eval_steps_per_second": 2.19,
+      "eval_wer": 0.2970656730321379,
+      "step": 4500
+    },
+    {
+      "epoch": 13.48,
+      "learning_rate": 4.4257471264367814e-05,
+      "loss": 1.0494,
+      "step": 6000
+    },
+    {
+      "epoch": 13.48,
+      "eval_cer": 0.1353350807264606,
+      "eval_loss": 0.2974083721637726,
+      "eval_runtime": 209.3107,
+      "eval_samples_per_second": 17.562,
+      "eval_steps_per_second": 2.198,
+      "eval_wer": 0.2867489520260829,
+      "step": 6000
+    },
+    {
+      "epoch": 16.85,
+      "learning_rate": 4.253448275862069e-05,
+      "loss": 1.0061,
+      "step": 7500
+    },
+    {
+      "epoch": 16.85,
+      "eval_cer": 0.1299610713897979,
+      "eval_loss": 0.2802002429962158,
+      "eval_runtime": 210.2437,
+      "eval_samples_per_second": 17.484,
+      "eval_steps_per_second": 2.188,
+      "eval_wer": 0.2745924545877969,
+      "step": 7500
+    },
+    {
+      "epoch": 20.22,
+      "learning_rate": 4.0810344827586214e-05,
+      "loss": 0.9629,
+      "step": 9000
+    },
+    {
+      "epoch": 20.22,
+      "eval_cer": 0.13255889697101292,
+      "eval_loss": 0.2843669652938843,
+      "eval_runtime": 212.4442,
+      "eval_samples_per_second": 17.303,
+      "eval_steps_per_second": 2.165,
+      "eval_wer": 0.2776432231020028,
+      "step": 9000
+    },
+    {
+      "epoch": 23.59,
+      "learning_rate": 3.908735632183908e-05,
+      "loss": 0.9267,
+      "step": 10500
+    },
+    {
+      "epoch": 23.59,
+      "eval_cer": 0.12550211703398112,
+      "eval_loss": 0.2576734721660614,
+      "eval_runtime": 210.3131,
+      "eval_samples_per_second": 17.479,
+      "eval_steps_per_second": 2.187,
+      "eval_wer": 0.2603400093153237,
+      "step": 10500
+    },
+    {
+      "epoch": 26.96,
+      "learning_rate": 3.73632183908046e-05,
+      "loss": 0.8984,
+      "step": 12000
+    },
+    {
+      "epoch": 26.96,
+      "eval_cer": 0.12256308451075577,
+      "eval_loss": 0.2508338689804077,
+      "eval_runtime": 209.2521,
+      "eval_samples_per_second": 17.567,
+      "eval_steps_per_second": 2.198,
+      "eval_wer": 0.2530740568234746,
+      "step": 12000
+    },
+    {
+      "epoch": 30.34,
+      "learning_rate": 3.564022988505747e-05,
+      "loss": 0.8729,
+      "step": 13500
+    },
+    {
+      "epoch": 30.34,
+      "eval_cer": 0.12540906059525103,
+      "eval_loss": 0.26286962628364563,
+      "eval_runtime": 208.7235,
+      "eval_samples_per_second": 17.612,
+      "eval_steps_per_second": 2.204,
+      "eval_wer": 0.2605728924080112,
+      "step": 13500
+    },
+    {
+      "epoch": 33.71,
+      "learning_rate": 3.3917241379310346e-05,
+      "loss": 0.8546,
+      "step": 15000
+    },
+    {
+      "epoch": 33.71,
+      "eval_cer": 0.11932161856165764,
+      "eval_loss": 0.2401771992444992,
+      "eval_runtime": 208.4946,
+      "eval_samples_per_second": 17.631,
+      "eval_steps_per_second": 2.206,
+      "eval_wer": 0.24473684210526317,
+      "step": 15000
+    },
+    {
+      "epoch": 37.08,
+      "learning_rate": 3.219310344827586e-05,
+      "loss": 0.8304,
+      "step": 16500
+    },
+    {
+      "epoch": 37.08,
+      "eval_cer": 0.12086480450393164,
+      "eval_loss": 0.25319021940231323,
+      "eval_runtime": 209.1002,
+      "eval_samples_per_second": 17.58,
+      "eval_steps_per_second": 2.2,
+      "eval_wer": 0.2472286911970191,
+      "step": 16500
+    },
+    {
+      "epoch": 40.45,
+      "learning_rate": 3.046896551724138e-05,
+      "loss": 0.8075,
+      "step": 18000
+    },
+    {
+      "epoch": 40.45,
+      "eval_cer": 0.11977139134885308,
+      "eval_loss": 0.2439287155866623,
+      "eval_runtime": 209.0991,
+      "eval_samples_per_second": 17.58,
+      "eval_steps_per_second": 2.2,
+      "eval_wer": 0.2468793665579879,
+      "step": 18000
+    },
+    {
+      "epoch": 43.82,
+      "learning_rate": 2.8747126436781612e-05,
+      "loss": 0.7827,
+      "step": 19500
+    },
+    {
+      "epoch": 43.82,
+      "eval_cer": 0.11672379298044264,
+      "eval_loss": 0.23866486549377441,
+      "eval_runtime": 208.9618,
+      "eval_samples_per_second": 17.592,
+      "eval_steps_per_second": 2.201,
+      "eval_wer": 0.23721471821145784,
+      "step": 19500
+    },
+    {
+      "epoch": 47.19,
+      "learning_rate": 2.7022988505747126e-05,
+      "loss": 0.7627,
+      "step": 21000
+    },
+    {
+      "epoch": 47.19,
+      "eval_cer": 0.11469981543806318,
+      "eval_loss": 0.23443765938282013,
+      "eval_runtime": 209.1358,
+      "eval_samples_per_second": 17.577,
+      "eval_steps_per_second": 2.2,
+      "eval_wer": 0.23306939916162087,
+      "step": 21000
+    },
+    {
+      "epoch": 50.56,
+      "learning_rate": 2.5300000000000002e-05,
+      "loss": 0.7402,
+      "step": 22500
+    },
+    {
+      "epoch": 50.56,
+      "eval_cer": 0.11345906292166198,
+      "eval_loss": 0.23135580122470856,
+      "eval_runtime": 210.5917,
+      "eval_samples_per_second": 17.456,
+      "eval_steps_per_second": 2.184,
+      "eval_wer": 0.22994876571960876,
+      "step": 22500
+    },
+    {
+      "epoch": 53.93,
+      "learning_rate": 2.357586206896552e-05,
+      "loss": 0.718,
+      "step": 24000
+    },
+    {
+      "epoch": 53.93,
+      "eval_cer": 0.1114040665663725,
+      "eval_loss": 0.22568760812282562,
+      "eval_runtime": 208.402,
+      "eval_samples_per_second": 17.639,
+      "eval_steps_per_second": 2.207,
+      "eval_wer": 0.22666511411271542,
+      "step": 24000
+    },
+    {
+      "epoch": 57.3,
+      "learning_rate": 2.1851724137931033e-05,
+      "loss": 0.7016,
+      "step": 25500
+    },
+    {
+      "epoch": 57.3,
+      "eval_cer": 0.10889929742388758,
+      "eval_loss": 0.22044427692890167,
+      "eval_runtime": 208.5673,
+      "eval_samples_per_second": 17.625,
+      "eval_steps_per_second": 2.206,
+      "eval_wer": 0.2183977643223102,
+      "step": 25500
+    },
+    {
+      "epoch": 60.67,
+      "learning_rate": 2.012873563218391e-05,
+      "loss": 0.6804,
+      "step": 27000
+    },
+    {
+      "epoch": 60.67,
+      "eval_cer": 0.10851931696573971,
+      "eval_loss": 0.22273367643356323,
+      "eval_runtime": 208.2294,
+      "eval_samples_per_second": 17.654,
+      "eval_steps_per_second": 2.209,
+      "eval_wer": 0.21811830461108522,
+      "step": 27000
+    },
+    {
+      "epoch": 64.04,
+      "learning_rate": 1.8405747126436782e-05,
+      "loss": 0.6625,
+      "step": 28500
+    },
+    {
+      "epoch": 64.04,
+      "eval_cer": 0.10578966142965708,
+      "eval_loss": 0.21378228068351746,
+      "eval_runtime": 209.3597,
+      "eval_samples_per_second": 17.558,
+      "eval_steps_per_second": 2.197,
+      "eval_wer": 0.21115510013972985,
+      "step": 28500
+    },
+    {
+      "epoch": 67.42,
+      "learning_rate": 1.66816091954023e-05,
+      "loss": 0.6465,
+      "step": 30000
+    },
+    {
+      "epoch": 67.42,
+      "eval_cer": 0.10442483366161577,
+      "eval_loss": 0.2140830010175705,
+      "eval_runtime": 208.6345,
+      "eval_samples_per_second": 17.619,
+      "eval_steps_per_second": 2.205,
+      "eval_wer": 0.20808104331625524,
+      "step": 30000
+    },
+    {
+      "epoch": 70.79,
+      "learning_rate": 1.4958620689655173e-05,
+      "loss": 0.6238,
+      "step": 31500
+    },
+    {
+      "epoch": 70.79,
+      "eval_cer": 0.1049754175907688,
+      "eval_loss": 0.21720194816589355,
+      "eval_runtime": 210.4781,
+      "eval_samples_per_second": 17.465,
+      "eval_steps_per_second": 2.186,
+      "eval_wer": 0.2082207731718677,
+      "step": 31500
+    },
+    {
+      "epoch": 74.16,
+      "learning_rate": 1.323448275862069e-05,
+      "loss": 0.6062,
+      "step": 33000
+    },
+    {
+      "epoch": 74.16,
+      "eval_cer": 0.10427749430029312,
+      "eval_loss": 0.2174130082130432,
+      "eval_runtime": 209.3158,
+      "eval_samples_per_second": 17.562,
+      "eval_steps_per_second": 2.198,
+      "eval_wer": 0.20582207731718677,
+      "step": 33000
+    },
+    {
+      "epoch": 77.53,
+      "learning_rate": 1.1510344827586207e-05,
+      "loss": 0.588,
+      "step": 34500
+    },
+    {
+      "epoch": 77.53,
+      "eval_cer": 0.1026955348418816,
+      "eval_loss": 0.21560049057006836,
+      "eval_runtime": 208.8439,
+      "eval_samples_per_second": 17.602,
+      "eval_steps_per_second": 2.203,
+      "eval_wer": 0.20344666977177456,
+      "step": 34500
+    },
+    {
+      "epoch": 80.9,
+      "learning_rate": 9.786206896551724e-06,
+      "loss": 0.5722,
+      "step": 36000
+    },
+    {
+      "epoch": 80.9,
+      "eval_cer": 0.10293593064193433,
+      "eval_loss": 0.21624404191970825,
+      "eval_runtime": 208.6816,
+      "eval_samples_per_second": 17.615,
+      "eval_steps_per_second": 2.204,
+      "eval_wer": 0.2032137866790871,
+      "step": 36000
+    },
+    {
+      "epoch": 84.27,
+      "learning_rate": 8.064367816091953e-06,
+      "loss": 0.5585,
+      "step": 37500
+    },
+    {
+      "epoch": 84.27,
+      "eval_cer": 0.10209066799013601,
+      "eval_loss": 0.21560421586036682,
+      "eval_runtime": 211.1243,
+      "eval_samples_per_second": 17.412,
+      "eval_steps_per_second": 2.179,
+      "eval_wer": 0.20216581276199347,
+      "step": 37500
+    },
+    {
+      "epoch": 87.64,
+      "learning_rate": 6.341379310344828e-06,
+      "loss": 0.5456,
+      "step": 39000
+    },
+    {
+      "epoch": 87.64,
+      "eval_cer": 0.10090419839632737,
+      "eval_loss": 0.21256230771541595,
+      "eval_runtime": 208.9966,
+      "eval_samples_per_second": 17.589,
+      "eval_steps_per_second": 2.201,
+      "eval_wer": 0.19930135072193758,
+      "step": 39000
+    },
+    {
+      "epoch": 91.01,
+      "learning_rate": 4.618390804597701e-06,
+      "loss": 0.5325,
+      "step": 40500
+    },
+    {
+      "epoch": 91.01,
+      "eval_cer": 0.10033810506071933,
+      "eval_loss": 0.2121460884809494,
+      "eval_runtime": 208.4119,
+      "eval_samples_per_second": 17.638,
+      "eval_steps_per_second": 2.207,
+      "eval_wer": 0.19659990684676293,
+      "step": 40500
+    },
+    {
+      "epoch": 94.38,
+      "learning_rate": 2.8942528735632185e-06,
+      "loss": 0.5229,
+      "step": 42000
+    },
+    {
+      "epoch": 94.38,
+      "eval_cer": 0.09914388076368318,
+      "eval_loss": 0.21041299402713776,
+      "eval_runtime": 208.604,
+      "eval_samples_per_second": 17.622,
+      "eval_steps_per_second": 2.205,
+      "eval_wer": 0.19410805775500697,
+      "step": 42000
+    },
+    {
+      "epoch": 97.75,
+      "learning_rate": 1.1701149425287358e-06,
+      "loss": 0.5134,
+      "step": 43500
+    },
+    {
+      "epoch": 97.75,
+      "eval_cer": 0.0991593901701382,
+      "eval_loss": 0.21077032387256622,
+      "eval_runtime": 208.8814,
+      "eval_samples_per_second": 17.599,
+      "eval_steps_per_second": 2.202,
+      "eval_wer": 0.19482999534233814,
+      "step": 43500
+    },
+    {
+      "epoch": 100.0,
+      "step": 44500,
+      "total_flos": 1.4850172866055105e+21,
+      "train_loss": 0.804292679347349,
+      "train_runtime": 300809.9995,
+      "train_samples_per_second": 9.48,
+      "train_steps_per_second": 0.148
+    }
+  ],
+  "max_steps": 44500,
+  "num_train_epochs": 100,
+  "total_flos": 1.4850172866055105e+21,
+  "trial_name": null,
+  "trial_params": null
+}