End of training

Browse files

Files changed (5) hide show

all_results.json +10 -10
eval_results.json +5 -5
runs/Sep28_11-08-12_9ba91903bbce/events.out.tfevents.1664365403.9ba91903bbce.65.2 +3 -0
train_results.json +5 -5
trainer_state.json +214 -214

all_results.json CHANGED Viewed

@@ -1,13 +1,13 @@
 {
     "epoch": 40.0,
-    "eval_accuracy": 1.0,
-    "eval_loss": 0.04307302460074425,
-    "eval_runtime": 7.4924,
-    "eval_samples_per_second": 5.339,
-    "eval_steps_per_second": 0.267,
-    "total_flos": 3.579662466809856e+17,
-    "train_loss": 0.17003339926401775,
-    "train_runtime": 8221.5625,
-    "train_samples_per_second": 1.751,
-    "train_steps_per_second": 0.015
 }

 {
     "epoch": 40.0,
+    "eval_accuracy": 0.9767441860465116,
+    "eval_loss": 0.14032752811908722,
+    "eval_runtime": 2.9988,
+    "eval_samples_per_second": 14.339,
+    "eval_steps_per_second": 0.667,
+    "total_flos": 3.7685890970025984e+17,
+    "train_loss": 0.15792271693547566,
+    "train_runtime": 1762.7321,
+    "train_samples_per_second": 8.6,
+    "train_steps_per_second": 0.068
 }

eval_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
     "epoch": 40.0,
-    "eval_accuracy": 1.0,
-    "eval_loss": 0.04307302460074425,
-    "eval_runtime": 7.4924,
-    "eval_samples_per_second": 5.339,
-    "eval_steps_per_second": 0.267
 }

 {
     "epoch": 40.0,
+    "eval_accuracy": 0.9767441860465116,
+    "eval_loss": 0.14032752811908722,
+    "eval_runtime": 2.9988,
+    "eval_samples_per_second": 14.339,
+    "eval_steps_per_second": 0.667
 }

runs/Sep28_11-08-12_9ba91903bbce/events.out.tfevents.1664365403.9ba91903bbce.65.2 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a3947326fd65896420d05f35b45e2681576af7edf961ca0382038c5c9df77a7b
+size 357

train_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
     "epoch": 40.0,
-    "total_flos": 3.579662466809856e+17,
-    "train_loss": 0.17003339926401775,
-    "train_runtime": 8221.5625,
-    "train_samples_per_second": 1.751,
-    "train_steps_per_second": 0.015
 }

 {
     "epoch": 40.0,
+    "total_flos": 3.7685890970025984e+17,
+    "train_loss": 0.15792271693547566,
+    "train_runtime": 1762.7321,
+    "train_samples_per_second": 8.6,
+    "train_steps_per_second": 0.068
 }

trainer_state.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
-  "best_metric": 1.0,
-  "best_model_checkpoint": "delivery_truck_classification\\checkpoint-18",
   "epoch": 40.0,
   "global_step": 120,
   "is_hyper_param_search": false,
@@ -9,413 +9,413 @@
   "log_history": [
     {
       "epoch": 1.0,
-      "eval_accuracy": 0.95,
-      "eval_loss": 0.16261602938175201,
-      "eval_runtime": 8.6031,
-      "eval_samples_per_second": 4.649,
-      "eval_steps_per_second": 0.232,
       "step": 3
     },
     {
       "epoch": 2.0,
-      "eval_accuracy": 0.95,
-      "eval_loss": 0.1592799872159958,
-      "eval_runtime": 8.1709,
-      "eval_samples_per_second": 4.895,
-      "eval_steps_per_second": 0.245,
       "step": 6
     },
     {
       "epoch": 3.0,
-      "eval_accuracy": 0.95,
-      "eval_loss": 0.13422292470932007,
-      "eval_runtime": 8.0249,
-      "eval_samples_per_second": 4.984,
-      "eval_steps_per_second": 0.249,
       "step": 9
     },
     {
       "epoch": 4.0,
-      "eval_accuracy": 0.975,
-      "eval_loss": 0.08705286681652069,
-      "eval_runtime": 8.0216,
-      "eval_samples_per_second": 4.987,
-      "eval_steps_per_second": 0.249,
       "step": 12
     },
     {
       "epoch": 5.0,
-      "eval_accuracy": 0.975,
-      "eval_loss": 0.06115349009633064,
-      "eval_runtime": 7.8977,
-      "eval_samples_per_second": 5.065,
-      "eval_steps_per_second": 0.253,
       "step": 15
     },
     {
       "epoch": 6.0,
-      "eval_accuracy": 1.0,
-      "eval_loss": 0.04307302460074425,
-      "eval_runtime": 8.1309,
-      "eval_samples_per_second": 4.92,
-      "eval_steps_per_second": 0.246,
       "step": 18
     },
     {
       "epoch": 6.67,
       "learning_rate": 4.62962962962963e-05,
-      "loss": 0.2745,
       "step": 20
     },
     {
       "epoch": 7.0,
-      "eval_accuracy": 1.0,
-      "eval_loss": 0.03329644352197647,
-      "eval_runtime": 8.4823,
-      "eval_samples_per_second": 4.716,
-      "eval_steps_per_second": 0.236,
       "step": 21
     },
     {
       "epoch": 8.0,
-      "eval_accuracy": 1.0,
-      "eval_loss": 0.048651862889528275,
-      "eval_runtime": 7.9701,
-      "eval_samples_per_second": 5.019,
-      "eval_steps_per_second": 0.251,
       "step": 24
     },
     {
       "epoch": 9.0,
-      "eval_accuracy": 1.0,
-      "eval_loss": 0.045587461441755295,
-      "eval_runtime": 7.8557,
-      "eval_samples_per_second": 5.092,
-      "eval_steps_per_second": 0.255,
       "step": 27
     },
     {
       "epoch": 10.0,
-      "eval_accuracy": 1.0,
-      "eval_loss": 0.02726823464035988,
-      "eval_runtime": 8.1787,
-      "eval_samples_per_second": 4.891,
-      "eval_steps_per_second": 0.245,
       "step": 30
     },
     {
       "epoch": 11.0,
-      "eval_accuracy": 1.0,
-      "eval_loss": 0.017963390797376633,
-      "eval_runtime": 8.3083,
-      "eval_samples_per_second": 4.814,
-      "eval_steps_per_second": 0.241,
       "step": 33
     },
     {
       "epoch": 12.0,
-      "eval_accuracy": 1.0,
-      "eval_loss": 0.016819924116134644,
-      "eval_runtime": 8.1002,
-      "eval_samples_per_second": 4.938,
-      "eval_steps_per_second": 0.247,
       "step": 36
     },
     {
       "epoch": 13.0,
-      "eval_accuracy": 1.0,
-      "eval_loss": 0.031003978103399277,
-      "eval_runtime": 8.1225,
-      "eval_samples_per_second": 4.925,
-      "eval_steps_per_second": 0.246,
       "step": 39
     },
     {
       "epoch": 13.33,
       "learning_rate": 3.7037037037037037e-05,
-      "loss": 0.1782,
       "step": 40
     },
     {
       "epoch": 14.0,
-      "eval_accuracy": 0.975,
-      "eval_loss": 0.043801963329315186,
-      "eval_runtime": 8.6445,
-      "eval_samples_per_second": 4.627,
-      "eval_steps_per_second": 0.231,
       "step": 42
     },
     {
       "epoch": 15.0,
-      "eval_accuracy": 0.975,
-      "eval_loss": 0.07503340393304825,
-      "eval_runtime": 7.8763,
-      "eval_samples_per_second": 5.079,
-      "eval_steps_per_second": 0.254,
       "step": 45
     },
     {
       "epoch": 16.0,
-      "eval_accuracy": 0.975,
-      "eval_loss": 0.03957166522741318,
-      "eval_runtime": 8.3356,
-      "eval_samples_per_second": 4.799,
-      "eval_steps_per_second": 0.24,
       "step": 48
     },
     {
       "epoch": 17.0,
-      "eval_accuracy": 1.0,
-      "eval_loss": 0.017652835696935654,
-      "eval_runtime": 7.9389,
-      "eval_samples_per_second": 5.038,
-      "eval_steps_per_second": 0.252,
       "step": 51
     },
     {
       "epoch": 18.0,
-      "eval_accuracy": 1.0,
-      "eval_loss": 0.02170238085091114,
-      "eval_runtime": 8.0236,
-      "eval_samples_per_second": 4.985,
-      "eval_steps_per_second": 0.249,
       "step": 54
     },
     {
       "epoch": 19.0,
-      "eval_accuracy": 1.0,
-      "eval_loss": 0.011599823832511902,
-      "eval_runtime": 8.0424,
-      "eval_samples_per_second": 4.974,
-      "eval_steps_per_second": 0.249,
       "step": 57
     },
     {
       "epoch": 20.0,
       "learning_rate": 2.777777777777778e-05,
-      "loss": 0.1624,
       "step": 60
     },
     {
       "epoch": 20.0,
-      "eval_accuracy": 1.0,
-      "eval_loss": 0.008052630349993706,
-      "eval_runtime": 8.0111,
-      "eval_samples_per_second": 4.993,
-      "eval_steps_per_second": 0.25,
       "step": 60
     },
     {
       "epoch": 21.0,
-      "eval_accuracy": 1.0,
-      "eval_loss": 0.006596912629902363,
-      "eval_runtime": 8.4146,
-      "eval_samples_per_second": 4.754,
-      "eval_steps_per_second": 0.238,
       "step": 63
     },
     {
       "epoch": 22.0,
-      "eval_accuracy": 1.0,
-      "eval_loss": 0.008253499865531921,
-      "eval_runtime": 8.4625,
-      "eval_samples_per_second": 4.727,
-      "eval_steps_per_second": 0.236,
       "step": 66
     },
     {
       "epoch": 23.0,
-      "eval_accuracy": 1.0,
-      "eval_loss": 0.012594206258654594,
-      "eval_runtime": 8.1933,
-      "eval_samples_per_second": 4.882,
-      "eval_steps_per_second": 0.244,
       "step": 69
     },
     {
       "epoch": 24.0,
-      "eval_accuracy": 1.0,
-      "eval_loss": 0.015849163755774498,
-      "eval_runtime": 7.9982,
-      "eval_samples_per_second": 5.001,
-      "eval_steps_per_second": 0.25,
       "step": 72
     },
     {
       "epoch": 25.0,
-      "eval_accuracy": 1.0,
-      "eval_loss": 0.01883917860686779,
-      "eval_runtime": 7.9429,
-      "eval_samples_per_second": 5.036,
-      "eval_steps_per_second": 0.252,
       "step": 75
     },
     {
       "epoch": 26.0,
-      "eval_accuracy": 1.0,
-      "eval_loss": 0.014945434406399727,
-      "eval_runtime": 8.0615,
-      "eval_samples_per_second": 4.962,
-      "eval_steps_per_second": 0.248,
       "step": 78
     },
     {
       "epoch": 26.67,
       "learning_rate": 1.8518518518518518e-05,
-      "loss": 0.1475,
       "step": 80
     },
     {
       "epoch": 27.0,
-      "eval_accuracy": 1.0,
-      "eval_loss": 0.010075708851218224,
-      "eval_runtime": 8.0344,
-      "eval_samples_per_second": 4.979,
-      "eval_steps_per_second": 0.249,
       "step": 81
     },
     {
       "epoch": 28.0,
-      "eval_accuracy": 1.0,
-      "eval_loss": 0.006395348347723484,
-      "eval_runtime": 7.9204,
-      "eval_samples_per_second": 5.05,
-      "eval_steps_per_second": 0.253,
       "step": 84
     },
     {
       "epoch": 29.0,
-      "eval_accuracy": 1.0,
-      "eval_loss": 0.004969631787389517,
-      "eval_runtime": 8.1818,
-      "eval_samples_per_second": 4.889,
-      "eval_steps_per_second": 0.244,
       "step": 87
     },
     {
       "epoch": 30.0,
-      "eval_accuracy": 1.0,
-      "eval_loss": 0.005222103092819452,
-      "eval_runtime": 7.9872,
-      "eval_samples_per_second": 5.008,
-      "eval_steps_per_second": 0.25,
       "step": 90
     },
     {
       "epoch": 31.0,
-      "eval_accuracy": 1.0,
-      "eval_loss": 0.006443561054766178,
-      "eval_runtime": 7.9514,
-      "eval_samples_per_second": 5.031,
-      "eval_steps_per_second": 0.252,
       "step": 93
     },
     {
       "epoch": 32.0,
-      "eval_accuracy": 1.0,
-      "eval_loss": 0.006998550146818161,
-      "eval_runtime": 7.9811,
-      "eval_samples_per_second": 5.012,
-      "eval_steps_per_second": 0.251,
       "step": 96
     },
     {
       "epoch": 33.0,
-      "eval_accuracy": 1.0,
-      "eval_loss": 0.006886245217174292,
-      "eval_runtime": 7.9804,
-      "eval_samples_per_second": 5.012,
-      "eval_steps_per_second": 0.251,
       "step": 99
     },
     {
       "epoch": 33.33,
       "learning_rate": 9.259259259259259e-06,
-      "loss": 0.1345,
       "step": 100
     },
     {
       "epoch": 34.0,
-      "eval_accuracy": 1.0,
-      "eval_loss": 0.005939379800111055,
-      "eval_runtime": 7.962,
-      "eval_samples_per_second": 5.024,
-      "eval_steps_per_second": 0.251,
       "step": 102
     },
     {
       "epoch": 35.0,
-      "eval_accuracy": 1.0,
-      "eval_loss": 0.004927521105855703,
-      "eval_runtime": 7.9624,
-      "eval_samples_per_second": 5.024,
-      "eval_steps_per_second": 0.251,
       "step": 105
     },
     {
       "epoch": 36.0,
-      "eval_accuracy": 1.0,
-      "eval_loss": 0.004319839645177126,
-      "eval_runtime": 8.2724,
-      "eval_samples_per_second": 4.835,
-      "eval_steps_per_second": 0.242,
       "step": 108
     },
     {
       "epoch": 37.0,
-      "eval_accuracy": 1.0,
-      "eval_loss": 0.0039680288173258305,
-      "eval_runtime": 7.994,
-      "eval_samples_per_second": 5.004,
-      "eval_steps_per_second": 0.25,
       "step": 111
     },
     {
       "epoch": 38.0,
-      "eval_accuracy": 1.0,
-      "eval_loss": 0.003840196877717972,
-      "eval_runtime": 7.8877,
-      "eval_samples_per_second": 5.071,
-      "eval_steps_per_second": 0.254,
       "step": 114
     },
     {
       "epoch": 39.0,
-      "eval_accuracy": 1.0,
-      "eval_loss": 0.0038244160823524,
-      "eval_runtime": 8.0172,
-      "eval_samples_per_second": 4.989,
-      "eval_steps_per_second": 0.249,
       "step": 117
     },
     {
       "epoch": 40.0,
       "learning_rate": 0.0,
-      "loss": 0.1232,
       "step": 120
     },
     {
       "epoch": 40.0,
-      "eval_accuracy": 1.0,
-      "eval_loss": 0.003828426357358694,
-      "eval_runtime": 7.9122,
-      "eval_samples_per_second": 5.055,
-      "eval_steps_per_second": 0.253,
       "step": 120
     },
     {
       "epoch": 40.0,
       "step": 120,
-      "total_flos": 3.579662466809856e+17,
-      "train_loss": 0.17003339926401775,
-      "train_runtime": 8221.5625,
-      "train_samples_per_second": 1.751,
-      "train_steps_per_second": 0.015
     }
   ],
   "max_steps": 120,
   "num_train_epochs": 40,
-  "total_flos": 3.579662466809856e+17,
   "trial_name": null,
   "trial_params": null
 }

 {
+  "best_metric": 0.9767441860465116,
+  "best_model_checkpoint": "delivery_truck_classification/checkpoint-9",
   "epoch": 40.0,
   "global_step": 120,
   "is_hyper_param_search": false,
   "log_history": [
     {
       "epoch": 1.0,
+      "eval_accuracy": 0.9534883720930233,
+      "eval_loss": 0.1490669548511505,
+      "eval_runtime": 2.9917,
+      "eval_samples_per_second": 14.373,
+      "eval_steps_per_second": 0.669,
       "step": 3
     },
     {
       "epoch": 2.0,
+      "eval_accuracy": 0.9534883720930233,
+      "eval_loss": 0.14621073007583618,
+      "eval_runtime": 3.3898,
+      "eval_samples_per_second": 12.685,
+      "eval_steps_per_second": 0.59,
       "step": 6
     },
     {
       "epoch": 3.0,
+      "eval_accuracy": 0.9767441860465116,
+      "eval_loss": 0.14032752811908722,
+      "eval_runtime": 3.2019,
+      "eval_samples_per_second": 13.429,
+      "eval_steps_per_second": 0.625,
       "step": 9
     },
     {
       "epoch": 4.0,
+      "eval_accuracy": 0.9767441860465116,
+      "eval_loss": 0.14311185479164124,
+      "eval_runtime": 2.9749,
+      "eval_samples_per_second": 14.455,
+      "eval_steps_per_second": 0.672,
       "step": 12
     },
     {
       "epoch": 5.0,
+      "eval_accuracy": 0.9534883720930233,
+      "eval_loss": 0.17613790929317474,
+      "eval_runtime": 3.2124,
+      "eval_samples_per_second": 13.386,
+      "eval_steps_per_second": 0.623,
       "step": 15
     },
     {
       "epoch": 6.0,
+      "eval_accuracy": 0.9534883720930233,
+      "eval_loss": 0.19303567707538605,
+      "eval_runtime": 3.2899,
+      "eval_samples_per_second": 13.07,
+      "eval_steps_per_second": 0.608,
       "step": 18
     },
     {
       "epoch": 6.67,
       "learning_rate": 4.62962962962963e-05,
+      "loss": 0.2637,
       "step": 20
     },
     {
       "epoch": 7.0,
+      "eval_accuracy": 0.9534883720930233,
+      "eval_loss": 0.16774171590805054,
+      "eval_runtime": 2.9265,
+      "eval_samples_per_second": 14.693,
+      "eval_steps_per_second": 0.683,
       "step": 21
     },
     {
       "epoch": 8.0,
+      "eval_accuracy": 0.9767441860465116,
+      "eval_loss": 0.18350879848003387,
+      "eval_runtime": 3.3322,
+      "eval_samples_per_second": 12.904,
+      "eval_steps_per_second": 0.6,
       "step": 24
     },
     {
       "epoch": 9.0,
+      "eval_accuracy": 0.9534883720930233,
+      "eval_loss": 0.18035028874874115,
+      "eval_runtime": 3.1848,
+      "eval_samples_per_second": 13.501,
+      "eval_steps_per_second": 0.628,
       "step": 27
     },
     {
       "epoch": 10.0,
+      "eval_accuracy": 0.9534883720930233,
+      "eval_loss": 0.18557493388652802,
+      "eval_runtime": 3.0604,
+      "eval_samples_per_second": 14.051,
+      "eval_steps_per_second": 0.654,
       "step": 30
     },
     {
       "epoch": 11.0,
+      "eval_accuracy": 0.9534883720930233,
+      "eval_loss": 0.17186354100704193,
+      "eval_runtime": 3.2354,
+      "eval_samples_per_second": 13.291,
+      "eval_steps_per_second": 0.618,
       "step": 33
     },
     {
       "epoch": 12.0,
+      "eval_accuracy": 0.9534883720930233,
+      "eval_loss": 0.16796864569187164,
+      "eval_runtime": 3.1706,
+      "eval_samples_per_second": 13.562,
+      "eval_steps_per_second": 0.631,
       "step": 36
     },
     {
       "epoch": 13.0,
+      "eval_accuracy": 0.9534883720930233,
+      "eval_loss": 0.15706905722618103,
+      "eval_runtime": 2.9572,
+      "eval_samples_per_second": 14.541,
+      "eval_steps_per_second": 0.676,
       "step": 39
     },
     {
       "epoch": 13.33,
       "learning_rate": 3.7037037037037037e-05,
+      "loss": 0.1687,
       "step": 40
     },
     {
       "epoch": 14.0,
+      "eval_accuracy": 0.9534883720930233,
+      "eval_loss": 0.13334713876247406,
+      "eval_runtime": 3.2093,
+      "eval_samples_per_second": 13.398,
+      "eval_steps_per_second": 0.623,
       "step": 42
     },
     {
       "epoch": 15.0,
+      "eval_accuracy": 0.9534883720930233,
+      "eval_loss": 0.12847872078418732,
+      "eval_runtime": 3.2531,
+      "eval_samples_per_second": 13.218,
+      "eval_steps_per_second": 0.615,
       "step": 45
     },
     {
       "epoch": 16.0,
+      "eval_accuracy": 0.9534883720930233,
+      "eval_loss": 0.12928344309329987,
+      "eval_runtime": 3.0101,
+      "eval_samples_per_second": 14.285,
+      "eval_steps_per_second": 0.664,
       "step": 48
     },
     {
       "epoch": 17.0,
+      "eval_accuracy": 0.9767441860465116,
+      "eval_loss": 0.12077976763248444,
+      "eval_runtime": 3.2048,
+      "eval_samples_per_second": 13.417,
+      "eval_steps_per_second": 0.624,
       "step": 51
     },
     {
       "epoch": 18.0,
+      "eval_accuracy": 0.9767441860465116,
+      "eval_loss": 0.1060628667473793,
+      "eval_runtime": 3.2421,
+      "eval_samples_per_second": 13.263,
+      "eval_steps_per_second": 0.617,
       "step": 54
     },
     {
       "epoch": 19.0,
+      "eval_accuracy": 0.9767441860465116,
+      "eval_loss": 0.09775999933481216,
+      "eval_runtime": 2.9563,
+      "eval_samples_per_second": 14.545,
+      "eval_steps_per_second": 0.677,
       "step": 57
     },
     {
       "epoch": 20.0,
       "learning_rate": 2.777777777777778e-05,
+      "loss": 0.1435,
       "step": 60
     },
     {
       "epoch": 20.0,
+      "eval_accuracy": 0.9534883720930233,
+      "eval_loss": 0.11002050340175629,
+      "eval_runtime": 3.164,
+      "eval_samples_per_second": 13.59,
+      "eval_steps_per_second": 0.632,
       "step": 60
     },
     {
       "epoch": 21.0,
+      "eval_accuracy": 0.9534883720930233,
+      "eval_loss": 0.1205144003033638,
+      "eval_runtime": 3.223,
+      "eval_samples_per_second": 13.342,
+      "eval_steps_per_second": 0.621,
       "step": 63
     },
     {
       "epoch": 22.0,
+      "eval_accuracy": 0.9767441860465116,
+      "eval_loss": 0.10268723964691162,
+      "eval_runtime": 2.9505,
+      "eval_samples_per_second": 14.574,
+      "eval_steps_per_second": 0.678,
       "step": 66
     },
     {
       "epoch": 23.0,
+      "eval_accuracy": 0.9767441860465116,
+      "eval_loss": 0.10407420247793198,
+      "eval_runtime": 3.2576,
+      "eval_samples_per_second": 13.2,
+      "eval_steps_per_second": 0.614,
       "step": 69
     },
     {
       "epoch": 24.0,
+      "eval_accuracy": 0.9767441860465116,
+      "eval_loss": 0.10208708792924881,
+      "eval_runtime": 3.1867,
+      "eval_samples_per_second": 13.494,
+      "eval_steps_per_second": 0.628,
       "step": 72
     },
     {
       "epoch": 25.0,
+      "eval_accuracy": 0.9767441860465116,
+      "eval_loss": 0.09740080684423447,
+      "eval_runtime": 2.9153,
+      "eval_samples_per_second": 14.75,
+      "eval_steps_per_second": 0.686,
       "step": 75
     },
     {
       "epoch": 26.0,
+      "eval_accuracy": 0.9534883720930233,
+      "eval_loss": 0.10056695342063904,
+      "eval_runtime": 3.2051,
+      "eval_samples_per_second": 13.416,
+      "eval_steps_per_second": 0.624,
       "step": 78
     },
     {
       "epoch": 26.67,
       "learning_rate": 1.8518518518518518e-05,
+      "loss": 0.1361,
       "step": 80
     },
     {
       "epoch": 27.0,
+      "eval_accuracy": 0.9534883720930233,
+      "eval_loss": 0.10110510140657425,
+      "eval_runtime": 3.2233,
+      "eval_samples_per_second": 13.34,
+      "eval_steps_per_second": 0.62,
       "step": 81
     },
     {
       "epoch": 28.0,
+      "eval_accuracy": 0.9767441860465116,
+      "eval_loss": 0.09926853328943253,
+      "eval_runtime": 2.9231,
+      "eval_samples_per_second": 14.711,
+      "eval_steps_per_second": 0.684,
       "step": 84
     },
     {
       "epoch": 29.0,
+      "eval_accuracy": 0.9767441860465116,
+      "eval_loss": 0.09514892101287842,
+      "eval_runtime": 3.1715,
+      "eval_samples_per_second": 13.558,
+      "eval_steps_per_second": 0.631,
       "step": 87
     },
     {
       "epoch": 30.0,
+      "eval_accuracy": 0.9767441860465116,
+      "eval_loss": 0.09706470370292664,
+      "eval_runtime": 3.2972,
+      "eval_samples_per_second": 13.041,
+      "eval_steps_per_second": 0.607,
       "step": 90
     },
     {
       "epoch": 31.0,
+      "eval_accuracy": 0.9767441860465116,
+      "eval_loss": 0.10362450033426285,
+      "eval_runtime": 2.9574,
+      "eval_samples_per_second": 14.54,
+      "eval_steps_per_second": 0.676,
       "step": 93
     },
     {
       "epoch": 32.0,
+      "eval_accuracy": 0.9767441860465116,
+      "eval_loss": 0.10851310193538666,
+      "eval_runtime": 3.2605,
+      "eval_samples_per_second": 13.188,
+      "eval_steps_per_second": 0.613,
       "step": 96
     },
     {
       "epoch": 33.0,
+      "eval_accuracy": 0.9767441860465116,
+      "eval_loss": 0.10988349467515945,
+      "eval_runtime": 3.2152,
+      "eval_samples_per_second": 13.374,
+      "eval_steps_per_second": 0.622,
       "step": 99
     },
     {
       "epoch": 33.33,
       "learning_rate": 9.259259259259259e-06,
+      "loss": 0.1221,
       "step": 100
     },
     {
       "epoch": 34.0,
+      "eval_accuracy": 0.9767441860465116,
+      "eval_loss": 0.11153779178857803,
+      "eval_runtime": 2.9113,
+      "eval_samples_per_second": 14.77,
+      "eval_steps_per_second": 0.687,
       "step": 102
     },
     {
       "epoch": 35.0,
+      "eval_accuracy": 0.9767441860465116,
+      "eval_loss": 0.11329730600118637,
+      "eval_runtime": 3.208,
+      "eval_samples_per_second": 13.404,
+      "eval_steps_per_second": 0.623,
       "step": 105
     },
     {
       "epoch": 36.0,
+      "eval_accuracy": 0.9534883720930233,
+      "eval_loss": 0.11842045933008194,
+      "eval_runtime": 3.2236,
+      "eval_samples_per_second": 13.339,
+      "eval_steps_per_second": 0.62,
       "step": 108
     },
     {
       "epoch": 37.0,
+      "eval_accuracy": 0.9534883720930233,
+      "eval_loss": 0.12152226269245148,
+      "eval_runtime": 2.9306,
+      "eval_samples_per_second": 14.673,
+      "eval_steps_per_second": 0.682,
       "step": 111
     },
     {
       "epoch": 38.0,
+      "eval_accuracy": 0.9534883720930233,
+      "eval_loss": 0.12237626314163208,
+      "eval_runtime": 3.2687,
+      "eval_samples_per_second": 13.155,
+      "eval_steps_per_second": 0.612,
       "step": 114
     },
     {
       "epoch": 39.0,
+      "eval_accuracy": 0.9534883720930233,
+      "eval_loss": 0.12215745449066162,
+      "eval_runtime": 3.2407,
+      "eval_samples_per_second": 13.269,
+      "eval_steps_per_second": 0.617,
       "step": 117
     },
     {
       "epoch": 40.0,
       "learning_rate": 0.0,
+      "loss": 0.1135,
       "step": 120
     },
     {
       "epoch": 40.0,
+      "eval_accuracy": 0.9534883720930233,
+      "eval_loss": 0.1217384859919548,
+      "eval_runtime": 2.9059,
+      "eval_samples_per_second": 14.797,
+      "eval_steps_per_second": 0.688,
       "step": 120
     },
     {
       "epoch": 40.0,
       "step": 120,
+      "total_flos": 3.7685890970025984e+17,
+      "train_loss": 0.15792271693547566,
+      "train_runtime": 1762.7321,
+      "train_samples_per_second": 8.6,
+      "train_steps_per_second": 0.068
     }
   ],
   "max_steps": 120,
   "num_train_epochs": 40,
+  "total_flos": 3.7685890970025984e+17,
   "trial_name": null,
   "trial_params": null
 }