End of training

Browse files

Files changed (5) hide show

all_results.json +8 -8
eval_results.json +4 -4
runs/Dec23_11-21-18_129-146-176-120/events.out.tfevents.1671798661.129-146-176-120.862675.2 +3 -0
train_results.json +5 -5
trainer_state.json +261 -12

all_results.json CHANGED Viewed

@@ -1,12 +1,12 @@
 {
-    "epoch": 587.82,
     "eval_loss": 0.56689453125,
-    "eval_runtime": 154.2304,
-    "eval_samples_per_second": 1.764,
-    "eval_steps_per_second": 0.11,
     "eval_wer": 9.899702823179792,
-    "train_loss": 1.4810419082641601e-05,
-    "train_runtime": 3866.6425,
-    "train_samples_per_second": 82.759,
-    "train_steps_per_second": 2.586
 }

 {
+    "epoch": 646.82,
     "eval_loss": 0.56689453125,
+    "eval_runtime": 153.5566,
+    "eval_samples_per_second": 1.771,
+    "eval_steps_per_second": 0.111,
     "eval_wer": 9.899702823179792,
+    "train_loss": 1.3152035799893466e-05,
+    "train_runtime": 3841.6705,
+    "train_samples_per_second": 91.627,
+    "train_steps_per_second": 2.863
 }

eval_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
-    "epoch": 587.82,
     "eval_loss": 0.56689453125,
-    "eval_runtime": 154.2304,
-    "eval_samples_per_second": 1.764,
-    "eval_steps_per_second": 0.11,
     "eval_wer": 9.899702823179792
 }

 {
+    "epoch": 646.82,
     "eval_loss": 0.56689453125,
+    "eval_runtime": 153.5566,
+    "eval_samples_per_second": 1.771,
+    "eval_steps_per_second": 0.111,
     "eval_wer": 9.899702823179792
 }

runs/Dec23_11-21-18_129-146-176-120/events.out.tfevents.1671798661.129-146-176-120.862675.2 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d3384bedae216f607575a8ac5d62e171cd6060d79d5164dce041c5d86b8a4129
+size 358

train_results.json CHANGED Viewed

@@ -1,7 +1,7 @@
 {
-    "epoch": 587.82,
-    "train_loss": 1.4810419082641601e-05,
-    "train_runtime": 3866.6425,
-    "train_samples_per_second": 82.759,
-    "train_steps_per_second": 2.586
 }

 {
+    "epoch": 646.82,
+    "train_loss": 1.3152035799893466e-05,
+    "train_runtime": 3841.6705,
+    "train_samples_per_second": 91.627,
+    "train_steps_per_second": 2.863
 }

trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": 9.899702823179792,
   "best_model_checkpoint": "./checkpoint-8000",
-  "epoch": 587.8235294117648,
-  "global_step": 10000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -2498,18 +2498,267 @@
       "step": 10000
     },
     {
-      "epoch": 587.82,
-      "step": 10000,
-      "total_flos": 3.080532552348504e+20,
-      "train_loss": 1.4810419082641601e-05,
-      "train_runtime": 3866.6425,
-      "train_samples_per_second": 82.759,
-      "train_steps_per_second": 2.586
     }
   ],
-  "max_steps": 10000,
-  "num_train_epochs": 589,
-  "total_flos": 3.080532552348504e+20,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": 9.899702823179792,
   "best_model_checkpoint": "./checkpoint-8000",
+  "epoch": 646.8235294117648,
+  "global_step": 11000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "step": 10000
     },
     {
+      "epoch": 589.47,
+      "learning_rate": 2.8514285714285715e-07,
+      "loss": 0.0002,
+      "step": 10025
+    },
+    {
+      "epoch": 590.94,
+      "learning_rate": 2.78e-07,
+      "loss": 0.0002,
+      "step": 10050
+    },
+    {
+      "epoch": 592.41,
+      "learning_rate": 2.7085714285714285e-07,
+      "loss": 0.0001,
+      "step": 10075
+    },
+    {
+      "epoch": 593.88,
+      "learning_rate": 2.6371428571428574e-07,
+      "loss": 0.0001,
+      "step": 10100
+    },
+    {
+      "epoch": 595.35,
+      "learning_rate": 2.565714285714286e-07,
+      "loss": 0.0001,
+      "step": 10125
+    },
+    {
+      "epoch": 596.82,
+      "learning_rate": 2.4942857142857144e-07,
+      "loss": 0.0001,
+      "step": 10150
+    },
+    {
+      "epoch": 598.29,
+      "learning_rate": 2.4228571428571427e-07,
+      "loss": 0.0002,
+      "step": 10175
+    },
+    {
+      "epoch": 599.76,
+      "learning_rate": 2.3514285714285715e-07,
+      "loss": 0.0002,
+      "step": 10200
+    },
+    {
+      "epoch": 601.24,
+      "learning_rate": 2.28e-07,
+      "loss": 0.0001,
+      "step": 10225
+    },
+    {
+      "epoch": 602.71,
+      "learning_rate": 2.2085714285714288e-07,
+      "loss": 0.0001,
+      "step": 10250
+    },
+    {
+      "epoch": 604.18,
+      "learning_rate": 2.137142857142857e-07,
+      "loss": 0.0001,
+      "step": 10275
+    },
+    {
+      "epoch": 605.65,
+      "learning_rate": 2.0657142857142856e-07,
+      "loss": 0.0001,
+      "step": 10300
+    },
+    {
+      "epoch": 607.12,
+      "learning_rate": 1.9942857142857144e-07,
+      "loss": 0.0001,
+      "step": 10325
+    },
+    {
+      "epoch": 608.59,
+      "learning_rate": 1.922857142857143e-07,
+      "loss": 0.0001,
+      "step": 10350
+    },
+    {
+      "epoch": 610.06,
+      "learning_rate": 1.8514285714285715e-07,
+      "loss": 0.0002,
+      "step": 10375
+    },
+    {
+      "epoch": 611.53,
+      "learning_rate": 1.78e-07,
+      "loss": 0.0001,
+      "step": 10400
+    },
+    {
+      "epoch": 613.0,
+      "learning_rate": 1.7085714285714286e-07,
+      "loss": 0.0003,
+      "step": 10425
+    },
+    {
+      "epoch": 614.47,
+      "learning_rate": 1.637142857142857e-07,
+      "loss": 0.0002,
+      "step": 10450
+    },
+    {
+      "epoch": 615.94,
+      "learning_rate": 1.5657142857142857e-07,
+      "loss": 0.0001,
+      "step": 10475
+    },
+    {
+      "epoch": 617.41,
+      "learning_rate": 1.4942857142857145e-07,
+      "loss": 0.0001,
+      "step": 10500
+    },
+    {
+      "epoch": 618.88,
+      "learning_rate": 1.422857142857143e-07,
+      "loss": 0.0002,
+      "step": 10525
+    },
+    {
+      "epoch": 620.35,
+      "learning_rate": 1.3514285714285713e-07,
+      "loss": 0.0001,
+      "step": 10550
+    },
+    {
+      "epoch": 621.82,
+      "learning_rate": 1.28e-07,
+      "loss": 0.0002,
+      "step": 10575
+    },
+    {
+      "epoch": 623.29,
+      "learning_rate": 1.2085714285714286e-07,
+      "loss": 0.0002,
+      "step": 10600
+    },
+    {
+      "epoch": 624.76,
+      "learning_rate": 1.1371428571428573e-07,
+      "loss": 0.0002,
+      "step": 10625
+    },
+    {
+      "epoch": 626.24,
+      "learning_rate": 1.0657142857142858e-07,
+      "loss": 0.0002,
+      "step": 10650
+    },
+    {
+      "epoch": 627.71,
+      "learning_rate": 9.942857142857142e-08,
+      "loss": 0.0002,
+      "step": 10675
+    },
+    {
+      "epoch": 629.18,
+      "learning_rate": 9.228571428571429e-08,
+      "loss": 0.0001,
+      "step": 10700
+    },
+    {
+      "epoch": 630.65,
+      "learning_rate": 8.514285714285714e-08,
+      "loss": 0.0001,
+      "step": 10725
+    },
+    {
+      "epoch": 632.12,
+      "learning_rate": 7.8e-08,
+      "loss": 0.0001,
+      "step": 10750
+    },
+    {
+      "epoch": 633.59,
+      "learning_rate": 7.085714285714286e-08,
+      "loss": 0.0002,
+      "step": 10775
+    },
+    {
+      "epoch": 635.06,
+      "learning_rate": 6.371428571428572e-08,
+      "loss": 0.0001,
+      "step": 10800
+    },
+    {
+      "epoch": 636.53,
+      "learning_rate": 5.657142857142857e-08,
+      "loss": 0.0001,
+      "step": 10825
+    },
+    {
+      "epoch": 638.0,
+      "learning_rate": 4.942857142857143e-08,
+      "loss": 0.0001,
+      "step": 10850
+    },
+    {
+      "epoch": 639.47,
+      "learning_rate": 4.2285714285714285e-08,
+      "loss": 0.0002,
+      "step": 10875
+    },
+    {
+      "epoch": 640.94,
+      "learning_rate": 3.514285714285714e-08,
+      "loss": 0.0001,
+      "step": 10900
+    },
+    {
+      "epoch": 642.41,
+      "learning_rate": 2.8000000000000003e-08,
+      "loss": 0.0001,
+      "step": 10925
+    },
+    {
+      "epoch": 643.88,
+      "learning_rate": 2.0857142857142856e-08,
+      "loss": 0.0001,
+      "step": 10950
+    },
+    {
+      "epoch": 645.35,
+      "learning_rate": 1.3714285714285715e-08,
+      "loss": 0.0001,
+      "step": 10975
+    },
+    {
+      "epoch": 646.82,
+      "learning_rate": 6.571428571428572e-09,
+      "loss": 0.0003,
+      "step": 11000
+    },
+    {
+      "epoch": 646.82,
+      "eval_loss": 0.56689453125,
+      "eval_runtime": 153.4429,
+      "eval_samples_per_second": 1.773,
+      "eval_steps_per_second": 0.111,
+      "eval_wer": 9.946136701337295,
+      "step": 11000
+    },
+    {
+      "epoch": 646.82,
+      "step": 11000,
+      "total_flos": 3.388775639915157e+20,
+      "train_loss": 1.3152035799893466e-05,
+      "train_runtime": 3841.6705,
+      "train_samples_per_second": 91.627,
+      "train_steps_per_second": 2.863
     }
   ],
+  "max_steps": 11000,
+  "num_train_epochs": 648,
+  "total_flos": 3.388775639915157e+20,
   "trial_name": null,
   "trial_params": null
 }