JEdward7777
/

delivery_truck_classification

@@ -1,13 +1,13 @@
 {
-    "epoch": 39.73,
     "eval_accuracy": 1.0,
-    "eval_loss": 0.0415542908012867,
-    "eval_runtime": 7.8769,
-    "eval_samples_per_second": 4.697,
-    "eval_steps_per_second": 0.254,
-    "total_flos": 3.262961773565706e+17,
-    "train_loss": 0.18748833239078522,
-    "train_runtime": 7500.5041,
-    "train_samples_per_second": 1.76,
-    "train_steps_per_second": 0.011
 }

 {
+    "epoch": 40.0,
     "eval_accuracy": 1.0,
+    "eval_loss": 0.04307302460074425,
+    "eval_runtime": 7.4924,
+    "eval_samples_per_second": 5.339,
+    "eval_steps_per_second": 0.267,
+    "total_flos": 3.579662466809856e+17,
+    "train_loss": 0.17003339926401775,
+    "train_runtime": 8221.5625,
+    "train_samples_per_second": 1.751,
+    "train_steps_per_second": 0.015
 }

eval_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
-    "epoch": 39.73,
     "eval_accuracy": 1.0,
-    "eval_loss": 0.0415542908012867,
-    "eval_runtime": 7.8769,
-    "eval_samples_per_second": 4.697,
-    "eval_steps_per_second": 0.254
 }

 {
+    "epoch": 40.0,
     "eval_accuracy": 1.0,
+    "eval_loss": 0.04307302460074425,
+    "eval_runtime": 7.4924,
+    "eval_samples_per_second": 5.339,
+    "eval_steps_per_second": 0.267
 }

train_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
-    "epoch": 39.73,
-    "total_flos": 3.262961773565706e+17,
-    "train_loss": 0.18748833239078522,
-    "train_runtime": 7500.5041,
-    "train_samples_per_second": 1.76,
-    "train_steps_per_second": 0.011
 }

 {
+    "epoch": 40.0,
+    "total_flos": 3.579662466809856e+17,
+    "train_loss": 0.17003339926401775,
+    "train_runtime": 8221.5625,
+    "train_samples_per_second": 1.751,
+    "train_steps_per_second": 0.015
 }

trainer_state.json CHANGED Viewed

@@ -1,409 +1,421 @@
 {
   "best_metric": 1.0,
-  "best_model_checkpoint": "delivery_truck_classification\\checkpoint-2",
-  "epoch": 39.72727272727273,
-  "global_step": 80,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
-      "epoch": 0.73,
-      "eval_accuracy": 1.0,
-      "eval_loss": 0.0415542908012867,
-      "eval_runtime": 7.7969,
-      "eval_samples_per_second": 4.745,
-      "eval_steps_per_second": 0.257,
-      "step": 2
     },
     {
-      "epoch": 1.73,
-      "eval_accuracy": 1.0,
-      "eval_loss": 0.03460519760847092,
-      "eval_runtime": 9.6408,
-      "eval_samples_per_second": 3.838,
-      "eval_steps_per_second": 0.207,
-      "step": 4
     },
     {
-      "epoch": 2.73,
-      "eval_accuracy": 1.0,
-      "eval_loss": 0.029270131140947342,
-      "eval_runtime": 11.5968,
-      "eval_samples_per_second": 3.191,
-      "eval_steps_per_second": 0.172,
-      "step": 6
     },
     {
-      "epoch": 3.73,
-      "eval_accuracy": 1.0,
-      "eval_loss": 0.01861225999891758,
-      "eval_runtime": 8.4881,
-      "eval_samples_per_second": 4.359,
-      "eval_steps_per_second": 0.236,
-      "step": 8
     },
     {
-      "epoch": 4.73,
       "eval_accuracy": 1.0,
-      "eval_loss": 0.020498055964708328,
-      "eval_runtime": 9.9982,
-      "eval_samples_per_second": 3.701,
-      "eval_steps_per_second": 0.2,
-      "step": 10
     },
     {
-      "epoch": 5.73,
-      "eval_accuracy": 0.972972972972973,
-      "eval_loss": 0.06043216958642006,
-      "eval_runtime": 8.9914,
-      "eval_samples_per_second": 4.115,
-      "eval_steps_per_second": 0.222,
-      "step": 12
     },
     {
-      "epoch": 6.73,
       "eval_accuracy": 1.0,
-      "eval_loss": 0.0332246832549572,
-      "eval_runtime": 8.8254,
-      "eval_samples_per_second": 4.192,
-      "eval_steps_per_second": 0.227,
-      "step": 14
     },
     {
-      "epoch": 7.73,
       "eval_accuracy": 1.0,
-      "eval_loss": 0.025004582479596138,
-      "eval_runtime": 11.8616,
-      "eval_samples_per_second": 3.119,
-      "eval_steps_per_second": 0.169,
-      "step": 16
     },
     {
-      "epoch": 8.73,
       "eval_accuracy": 1.0,
-      "eval_loss": 0.03864024579524994,
-      "eval_runtime": 8.8843,
-      "eval_samples_per_second": 4.165,
-      "eval_steps_per_second": 0.225,
-      "step": 18
     },
     {
-      "epoch": 9.73,
-      "learning_rate": 4.166666666666667e-05,
-      "loss": 0.2483,
-      "step": 20
     },
     {
-      "epoch": 9.73,
       "eval_accuracy": 1.0,
-      "eval_loss": 0.04379289597272873,
-      "eval_runtime": 8.6752,
-      "eval_samples_per_second": 4.265,
-      "eval_steps_per_second": 0.231,
-      "step": 20
     },
     {
-      "epoch": 10.73,
       "eval_accuracy": 1.0,
-      "eval_loss": 0.04468226432800293,
-      "eval_runtime": 8.2704,
-      "eval_samples_per_second": 4.474,
-      "eval_steps_per_second": 0.242,
-      "step": 22
     },
     {
-      "epoch": 11.73,
-      "eval_accuracy": 0.972972972972973,
-      "eval_loss": 0.06756877154111862,
-      "eval_runtime": 8.2231,
-      "eval_samples_per_second": 4.5,
-      "eval_steps_per_second": 0.243,
-      "step": 24
     },
     {
-      "epoch": 12.73,
-      "eval_accuracy": 0.972972972972973,
-      "eval_loss": 0.07861027866601944,
-      "eval_runtime": 8.9079,
-      "eval_samples_per_second": 4.154,
-      "eval_steps_per_second": 0.225,
-      "step": 26
     },
     {
-      "epoch": 13.73,
-      "eval_accuracy": 1.0,
-      "eval_loss": 0.03886393457651138,
-      "eval_runtime": 7.4091,
-      "eval_samples_per_second": 4.994,
-      "eval_steps_per_second": 0.27,
-      "step": 28
     },
     {
-      "epoch": 14.73,
-      "eval_accuracy": 1.0,
-      "eval_loss": 0.02784094214439392,
-      "eval_runtime": 9.7376,
-      "eval_samples_per_second": 3.8,
-      "eval_steps_per_second": 0.205,
-      "step": 30
     },
     {
-      "epoch": 15.73,
-      "eval_accuracy": 1.0,
-      "eval_loss": 0.02497038058936596,
-      "eval_runtime": 7.3256,
-      "eval_samples_per_second": 5.051,
-      "eval_steps_per_second": 0.273,
-      "step": 32
     },
     {
-      "epoch": 16.73,
       "eval_accuracy": 1.0,
-      "eval_loss": 0.02828327752649784,
-      "eval_runtime": 11.0099,
-      "eval_samples_per_second": 3.361,
-      "eval_steps_per_second": 0.182,
-      "step": 34
     },
     {
-      "epoch": 17.73,
-      "eval_accuracy": 0.972972972972973,
-      "eval_loss": 0.05021832138299942,
-      "eval_runtime": 9.5468,
-      "eval_samples_per_second": 3.876,
-      "eval_steps_per_second": 0.209,
-      "step": 36
     },
     {
-      "epoch": 18.73,
-      "eval_accuracy": 0.972972972972973,
-      "eval_loss": 0.07113233208656311,
-      "eval_runtime": 7.5069,
-      "eval_samples_per_second": 4.929,
-      "eval_steps_per_second": 0.266,
-      "step": 38
     },
     {
-      "epoch": 19.73,
       "learning_rate": 2.777777777777778e-05,
-      "loss": 0.1759,
-      "step": 40
     },
     {
-      "epoch": 19.73,
-      "eval_accuracy": 0.972972972972973,
-      "eval_loss": 0.06368651241064072,
-      "eval_runtime": 10.8688,
-      "eval_samples_per_second": 3.404,
-      "eval_steps_per_second": 0.184,
-      "step": 40
     },
     {
-      "epoch": 20.73,
       "eval_accuracy": 1.0,
-      "eval_loss": 0.04590895399451256,
-      "eval_runtime": 7.36,
-      "eval_samples_per_second": 5.027,
-      "eval_steps_per_second": 0.272,
-      "step": 42
     },
     {
-      "epoch": 21.73,
       "eval_accuracy": 1.0,
-      "eval_loss": 0.03937483951449394,
-      "eval_runtime": 7.6664,
-      "eval_samples_per_second": 4.826,
-      "eval_steps_per_second": 0.261,
-      "step": 44
     },
     {
-      "epoch": 22.73,
       "eval_accuracy": 1.0,
-      "eval_loss": 0.04189879819750786,
-      "eval_runtime": 7.6918,
-      "eval_samples_per_second": 4.81,
-      "eval_steps_per_second": 0.26,
-      "step": 46
     },
     {
-      "epoch": 23.73,
       "eval_accuracy": 1.0,
-      "eval_loss": 0.042252812534570694,
-      "eval_runtime": 9.2536,
-      "eval_samples_per_second": 3.998,
-      "eval_steps_per_second": 0.216,
-      "step": 48
     },
     {
-      "epoch": 24.73,
-      "eval_accuracy": 0.972972972972973,
-      "eval_loss": 0.046256761997938156,
-      "eval_runtime": 8.404,
-      "eval_samples_per_second": 4.403,
-      "eval_steps_per_second": 0.238,
-      "step": 50
     },
     {
-      "epoch": 25.73,
-      "eval_accuracy": 0.972972972972973,
-      "eval_loss": 0.050322916358709335,
-      "eval_runtime": 7.2832,
-      "eval_samples_per_second": 5.08,
-      "eval_steps_per_second": 0.275,
-      "step": 52
     },
     {
-      "epoch": 26.73,
-      "eval_accuracy": 0.972972972972973,
-      "eval_loss": 0.061594847589731216,
-      "eval_runtime": 7.736,
-      "eval_samples_per_second": 4.783,
-      "eval_steps_per_second": 0.259,
-      "step": 54
     },
     {
-      "epoch": 27.73,
-      "eval_accuracy": 0.972972972972973,
-      "eval_loss": 0.0641237199306488,
-      "eval_runtime": 8.3429,
-      "eval_samples_per_second": 4.435,
-      "eval_steps_per_second": 0.24,
-      "step": 56
     },
     {
-      "epoch": 28.73,
-      "eval_accuracy": 0.972972972972973,
-      "eval_loss": 0.05289805307984352,
-      "eval_runtime": 6.6939,
-      "eval_samples_per_second": 5.527,
-      "eval_steps_per_second": 0.299,
-      "step": 58
     },
     {
-      "epoch": 29.73,
-      "learning_rate": 1.388888888888889e-05,
-      "loss": 0.1669,
-      "step": 60
     },
     {
-      "epoch": 29.73,
-      "eval_accuracy": 0.972972972972973,
-      "eval_loss": 0.048487674444913864,
-      "eval_runtime": 8.2178,
-      "eval_samples_per_second": 4.502,
-      "eval_steps_per_second": 0.243,
-      "step": 60
     },
     {
-      "epoch": 30.73,
-      "eval_accuracy": 0.972972972972973,
-      "eval_loss": 0.04654627665877342,
-      "eval_runtime": 9.0621,
-      "eval_samples_per_second": 4.083,
-      "eval_steps_per_second": 0.221,
-      "step": 62
     },
     {
-      "epoch": 31.73,
-      "eval_accuracy": 0.972972972972973,
-      "eval_loss": 0.045613404363393784,
-      "eval_runtime": 7.5057,
-      "eval_samples_per_second": 4.93,
-      "eval_steps_per_second": 0.266,
-      "step": 64
     },
     {
-      "epoch": 32.73,
-      "eval_accuracy": 0.972972972972973,
-      "eval_loss": 0.047752730548381805,
-      "eval_runtime": 7.6794,
-      "eval_samples_per_second": 4.818,
-      "eval_steps_per_second": 0.26,
-      "step": 66
     },
     {
-      "epoch": 33.73,
-      "eval_accuracy": 0.972972972972973,
-      "eval_loss": 0.0467178151011467,
-      "eval_runtime": 7.7621,
-      "eval_samples_per_second": 4.767,
-      "eval_steps_per_second": 0.258,
-      "step": 68
     },
     {
-      "epoch": 34.73,
-      "eval_accuracy": 0.972972972972973,
-      "eval_loss": 0.04733948037028313,
-      "eval_runtime": 8.0246,
-      "eval_samples_per_second": 4.611,
-      "eval_steps_per_second": 0.249,
-      "step": 70
     },
     {
-      "epoch": 35.73,
-      "eval_accuracy": 0.972972972972973,
-      "eval_loss": 0.048583876341581345,
-      "eval_runtime": 8.5589,
-      "eval_samples_per_second": 4.323,
-      "eval_steps_per_second": 0.234,
-      "step": 72
     },
     {
-      "epoch": 36.73,
-      "eval_accuracy": 0.972972972972973,
-      "eval_loss": 0.05004884675145149,
-      "eval_runtime": 7.4868,
-      "eval_samples_per_second": 4.942,
-      "eval_steps_per_second": 0.267,
-      "step": 74
     },
     {
-      "epoch": 37.73,
-      "eval_accuracy": 0.972972972972973,
-      "eval_loss": 0.0501551553606987,
-      "eval_runtime": 8.2774,
-      "eval_samples_per_second": 4.47,
-      "eval_steps_per_second": 0.242,
-      "step": 76
     },
     {
-      "epoch": 38.73,
-      "eval_accuracy": 0.972972972972973,
-      "eval_loss": 0.05001495033502579,
-      "eval_runtime": 7.8563,
-      "eval_samples_per_second": 4.71,
-      "eval_steps_per_second": 0.255,
-      "step": 78
     },
     {
-      "epoch": 39.73,
-      "learning_rate": 0.0,
-      "loss": 0.1589,
-      "step": 80
     },
     {
-      "epoch": 39.73,
-      "eval_accuracy": 0.972972972972973,
-      "eval_loss": 0.04929113760590553,
-      "eval_runtime": 8.4253,
-      "eval_samples_per_second": 4.392,
-      "eval_steps_per_second": 0.237,
-      "step": 80
     },
     {
-      "epoch": 39.73,
-      "step": 80,
-      "total_flos": 3.262961773565706e+17,
-      "train_loss": 0.18748833239078522,
-      "train_runtime": 7500.5041,
-      "train_samples_per_second": 1.76,
-      "train_steps_per_second": 0.011
     }
   ],
-  "max_steps": 80,
   "num_train_epochs": 40,
-  "total_flos": 3.262961773565706e+17,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": 1.0,
+  "best_model_checkpoint": "delivery_truck_classification\\checkpoint-18",
+  "epoch": 40.0,
+  "global_step": 120,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
+      "epoch": 1.0,
+      "eval_accuracy": 0.95,
+      "eval_loss": 0.16261602938175201,
+      "eval_runtime": 8.6031,
+      "eval_samples_per_second": 4.649,
+      "eval_steps_per_second": 0.232,
+      "step": 3
+    },
+    {
+      "epoch": 2.0,
+      "eval_accuracy": 0.95,
+      "eval_loss": 0.1592799872159958,
+      "eval_runtime": 8.1709,
+      "eval_samples_per_second": 4.895,
+      "eval_steps_per_second": 0.245,
+      "step": 6
     },
     {
+      "epoch": 3.0,
+      "eval_accuracy": 0.95,
+      "eval_loss": 0.13422292470932007,
+      "eval_runtime": 8.0249,
+      "eval_samples_per_second": 4.984,
+      "eval_steps_per_second": 0.249,
+      "step": 9
     },
     {
+      "epoch": 4.0,
+      "eval_accuracy": 0.975,
+      "eval_loss": 0.08705286681652069,
+      "eval_runtime": 8.0216,
+      "eval_samples_per_second": 4.987,
+      "eval_steps_per_second": 0.249,
+      "step": 12
     },
     {
+      "epoch": 5.0,
+      "eval_accuracy": 0.975,
+      "eval_loss": 0.06115349009633064,
+      "eval_runtime": 7.8977,
+      "eval_samples_per_second": 5.065,
+      "eval_steps_per_second": 0.253,
+      "step": 15
     },
     {
+      "epoch": 6.0,
       "eval_accuracy": 1.0,
+      "eval_loss": 0.04307302460074425,
+      "eval_runtime": 8.1309,
+      "eval_samples_per_second": 4.92,
+      "eval_steps_per_second": 0.246,
+      "step": 18
     },
     {
+      "epoch": 6.67,
+      "learning_rate": 4.62962962962963e-05,
+      "loss": 0.2745,
+      "step": 20
     },
     {
+      "epoch": 7.0,
       "eval_accuracy": 1.0,
+      "eval_loss": 0.03329644352197647,
+      "eval_runtime": 8.4823,
+      "eval_samples_per_second": 4.716,
+      "eval_steps_per_second": 0.236,
+      "step": 21
     },
     {
+      "epoch": 8.0,
       "eval_accuracy": 1.0,
+      "eval_loss": 0.048651862889528275,
+      "eval_runtime": 7.9701,
+      "eval_samples_per_second": 5.019,
+      "eval_steps_per_second": 0.251,
+      "step": 24
     },
     {
+      "epoch": 9.0,
       "eval_accuracy": 1.0,
+      "eval_loss": 0.045587461441755295,
+      "eval_runtime": 7.8557,
+      "eval_samples_per_second": 5.092,
+      "eval_steps_per_second": 0.255,
+      "step": 27
     },
     {
+      "epoch": 10.0,
+      "eval_accuracy": 1.0,
+      "eval_loss": 0.02726823464035988,
+      "eval_runtime": 8.1787,
+      "eval_samples_per_second": 4.891,
+      "eval_steps_per_second": 0.245,
+      "step": 30
     },
     {
+      "epoch": 11.0,
       "eval_accuracy": 1.0,
+      "eval_loss": 0.017963390797376633,
+      "eval_runtime": 8.3083,
+      "eval_samples_per_second": 4.814,
+      "eval_steps_per_second": 0.241,
+      "step": 33
     },
     {
+      "epoch": 12.0,
       "eval_accuracy": 1.0,
+      "eval_loss": 0.016819924116134644,
+      "eval_runtime": 8.1002,
+      "eval_samples_per_second": 4.938,
+      "eval_steps_per_second": 0.247,
+      "step": 36
     },
     {
+      "epoch": 13.0,
+      "eval_accuracy": 1.0,
+      "eval_loss": 0.031003978103399277,
+      "eval_runtime": 8.1225,
+      "eval_samples_per_second": 4.925,
+      "eval_steps_per_second": 0.246,
+      "step": 39
     },
     {
+      "epoch": 13.33,
+      "learning_rate": 3.7037037037037037e-05,
+      "loss": 0.1782,
+      "step": 40
     },
     {
+      "epoch": 14.0,
+      "eval_accuracy": 0.975,
+      "eval_loss": 0.043801963329315186,
+      "eval_runtime": 8.6445,
+      "eval_samples_per_second": 4.627,
+      "eval_steps_per_second": 0.231,
+      "step": 42
     },
     {
+      "epoch": 15.0,
+      "eval_accuracy": 0.975,
+      "eval_loss": 0.07503340393304825,
+      "eval_runtime": 7.8763,
+      "eval_samples_per_second": 5.079,
+      "eval_steps_per_second": 0.254,
+      "step": 45
     },
     {
+      "epoch": 16.0,
+      "eval_accuracy": 0.975,
+      "eval_loss": 0.03957166522741318,
+      "eval_runtime": 8.3356,
+      "eval_samples_per_second": 4.799,
+      "eval_steps_per_second": 0.24,
+      "step": 48
     },
     {
+      "epoch": 17.0,
       "eval_accuracy": 1.0,
+      "eval_loss": 0.017652835696935654,
+      "eval_runtime": 7.9389,
+      "eval_samples_per_second": 5.038,
+      "eval_steps_per_second": 0.252,
+      "step": 51
     },
     {
+      "epoch": 18.0,
+      "eval_accuracy": 1.0,
+      "eval_loss": 0.02170238085091114,
+      "eval_runtime": 8.0236,
+      "eval_samples_per_second": 4.985,
+      "eval_steps_per_second": 0.249,
+      "step": 54
     },
     {
+      "epoch": 19.0,
+      "eval_accuracy": 1.0,
+      "eval_loss": 0.011599823832511902,
+      "eval_runtime": 8.0424,
+      "eval_samples_per_second": 4.974,
+      "eval_steps_per_second": 0.249,
+      "step": 57
     },
     {
+      "epoch": 20.0,
       "learning_rate": 2.777777777777778e-05,
+      "loss": 0.1624,
+      "step": 60
     },
     {
+      "epoch": 20.0,
+      "eval_accuracy": 1.0,
+      "eval_loss": 0.008052630349993706,
+      "eval_runtime": 8.0111,
+      "eval_samples_per_second": 4.993,
+      "eval_steps_per_second": 0.25,
+      "step": 60
     },
     {
+      "epoch": 21.0,
       "eval_accuracy": 1.0,
+      "eval_loss": 0.006596912629902363,
+      "eval_runtime": 8.4146,
+      "eval_samples_per_second": 4.754,
+      "eval_steps_per_second": 0.238,
+      "step": 63
     },
     {
+      "epoch": 22.0,
       "eval_accuracy": 1.0,
+      "eval_loss": 0.008253499865531921,
+      "eval_runtime": 8.4625,
+      "eval_samples_per_second": 4.727,
+      "eval_steps_per_second": 0.236,
+      "step": 66
     },
     {
+      "epoch": 23.0,
       "eval_accuracy": 1.0,
+      "eval_loss": 0.012594206258654594,
+      "eval_runtime": 8.1933,
+      "eval_samples_per_second": 4.882,
+      "eval_steps_per_second": 0.244,
+      "step": 69
     },
     {
+      "epoch": 24.0,
       "eval_accuracy": 1.0,
+      "eval_loss": 0.015849163755774498,
+      "eval_runtime": 7.9982,
+      "eval_samples_per_second": 5.001,
+      "eval_steps_per_second": 0.25,
+      "step": 72
     },
     {
+      "epoch": 25.0,
+      "eval_accuracy": 1.0,
+      "eval_loss": 0.01883917860686779,
+      "eval_runtime": 7.9429,
+      "eval_samples_per_second": 5.036,
+      "eval_steps_per_second": 0.252,
+      "step": 75
     },
     {
+      "epoch": 26.0,
+      "eval_accuracy": 1.0,
+      "eval_loss": 0.014945434406399727,
+      "eval_runtime": 8.0615,
+      "eval_samples_per_second": 4.962,
+      "eval_steps_per_second": 0.248,
+      "step": 78
     },
     {
+      "epoch": 26.67,
+      "learning_rate": 1.8518518518518518e-05,
+      "loss": 0.1475,
+      "step": 80
     },
     {
+      "epoch": 27.0,
+      "eval_accuracy": 1.0,
+      "eval_loss": 0.010075708851218224,
+      "eval_runtime": 8.0344,
+      "eval_samples_per_second": 4.979,
+      "eval_steps_per_second": 0.249,
+      "step": 81
     },
     {
+      "epoch": 28.0,
+      "eval_accuracy": 1.0,
+      "eval_loss": 0.006395348347723484,
+      "eval_runtime": 7.9204,
+      "eval_samples_per_second": 5.05,
+      "eval_steps_per_second": 0.253,
+      "step": 84
     },
     {
+      "epoch": 29.0,
+      "eval_accuracy": 1.0,
+      "eval_loss": 0.004969631787389517,
+      "eval_runtime": 8.1818,
+      "eval_samples_per_second": 4.889,
+      "eval_steps_per_second": 0.244,
+      "step": 87
     },
     {
+      "epoch": 30.0,
+      "eval_accuracy": 1.0,
+      "eval_loss": 0.005222103092819452,
+      "eval_runtime": 7.9872,
+      "eval_samples_per_second": 5.008,
+      "eval_steps_per_second": 0.25,
+      "step": 90
     },
     {
+      "epoch": 31.0,
+      "eval_accuracy": 1.0,
+      "eval_loss": 0.006443561054766178,
+      "eval_runtime": 7.9514,
+      "eval_samples_per_second": 5.031,
+      "eval_steps_per_second": 0.252,
+      "step": 93
     },
     {
+      "epoch": 32.0,
+      "eval_accuracy": 1.0,
+      "eval_loss": 0.006998550146818161,
+      "eval_runtime": 7.9811,
+      "eval_samples_per_second": 5.012,
+      "eval_steps_per_second": 0.251,
+      "step": 96
     },
     {
+      "epoch": 33.0,
+      "eval_accuracy": 1.0,
+      "eval_loss": 0.006886245217174292,
+      "eval_runtime": 7.9804,
+      "eval_samples_per_second": 5.012,
+      "eval_steps_per_second": 0.251,
+      "step": 99
     },
     {
+      "epoch": 33.33,
+      "learning_rate": 9.259259259259259e-06,
+      "loss": 0.1345,
+      "step": 100
     },
     {
+      "epoch": 34.0,
+      "eval_accuracy": 1.0,
+      "eval_loss": 0.005939379800111055,
+      "eval_runtime": 7.962,
+      "eval_samples_per_second": 5.024,
+      "eval_steps_per_second": 0.251,
+      "step": 102
     },
     {
+      "epoch": 35.0,
+      "eval_accuracy": 1.0,
+      "eval_loss": 0.004927521105855703,
+      "eval_runtime": 7.9624,
+      "eval_samples_per_second": 5.024,
+      "eval_steps_per_second": 0.251,
+      "step": 105
     },
     {
+      "epoch": 36.0,
+      "eval_accuracy": 1.0,
+      "eval_loss": 0.004319839645177126,
+      "eval_runtime": 8.2724,
+      "eval_samples_per_second": 4.835,
+      "eval_steps_per_second": 0.242,
+      "step": 108
     },
     {
+      "epoch": 37.0,
+      "eval_accuracy": 1.0,
+      "eval_loss": 0.0039680288173258305,
+      "eval_runtime": 7.994,
+      "eval_samples_per_second": 5.004,
+      "eval_steps_per_second": 0.25,
+      "step": 111
     },
     {
+      "epoch": 38.0,
+      "eval_accuracy": 1.0,
+      "eval_loss": 0.003840196877717972,
+      "eval_runtime": 7.8877,
+      "eval_samples_per_second": 5.071,
+      "eval_steps_per_second": 0.254,
+      "step": 114
     },
     {
+      "epoch": 39.0,
+      "eval_accuracy": 1.0,
+      "eval_loss": 0.0038244160823524,
+      "eval_runtime": 8.0172,
+      "eval_samples_per_second": 4.989,
+      "eval_steps_per_second": 0.249,
+      "step": 117
     },
     {
+      "epoch": 40.0,
+      "learning_rate": 0.0,
+      "loss": 0.1232,
+      "step": 120
     },
     {
+      "epoch": 40.0,
+      "eval_accuracy": 1.0,
+      "eval_loss": 0.003828426357358694,
+      "eval_runtime": 7.9122,
+      "eval_samples_per_second": 5.055,
+      "eval_steps_per_second": 0.253,
+      "step": 120
+    },
+    {
+      "epoch": 40.0,
+      "step": 120,
+      "total_flos": 3.579662466809856e+17,
+      "train_loss": 0.17003339926401775,
+      "train_runtime": 8221.5625,
+      "train_samples_per_second": 1.751,
+      "train_steps_per_second": 0.015
     }
   ],
+  "max_steps": 120,
   "num_train_epochs": 40,
+  "total_flos": 3.579662466809856e+17,
   "trial_name": null,
   "trial_params": null
 }