JEdward7777
/

delivery_truck_classification

@@ -1,13 +1,13 @@
 {
-    "epoch": 39.57,
-    "eval_accuracy": 1.0,
-    "eval_loss": 0.21797223389148712,
-    "eval_runtime": 3.8754,
-    "eval_samples_per_second": 5.677,
-    "eval_steps_per_second": 0.258,
-    "total_flos": 1.9417183005730406e+17,
-    "train_loss": 1.3339122772216796,
-    "train_runtime": 965.4815,
-    "train_samples_per_second": 8.162,
-    "train_steps_per_second": 0.041
 }

 {
+    "epoch": 39.8,
+    "eval_accuracy": 0.9714285714285714,
+    "eval_loss": 0.1382756382226944,
+    "eval_runtime": 6.6641,
+    "eval_samples_per_second": 5.252,
+    "eval_steps_per_second": 0.3,
+    "total_flos": 3.088453228308726e+17,
+    "train_loss": 0.15159874260425568,
+    "train_runtime": 6474.8036,
+    "train_samples_per_second": 1.927,
+    "train_steps_per_second": 0.012
 }

eval_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
-    "epoch": 39.57,
-    "eval_accuracy": 1.0,
-    "eval_loss": 0.21797223389148712,
-    "eval_runtime": 3.8754,
-    "eval_samples_per_second": 5.677,
-    "eval_steps_per_second": 0.258
 }

 {
+    "epoch": 39.8,
+    "eval_accuracy": 0.9714285714285714,
+    "eval_loss": 0.1382756382226944,
+    "eval_runtime": 6.6641,
+    "eval_samples_per_second": 5.252,
+    "eval_steps_per_second": 0.3
 }

train_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
-    "epoch": 39.57,
-    "total_flos": 1.9417183005730406e+17,
-    "train_loss": 1.3339122772216796,
-    "train_runtime": 965.4815,
-    "train_samples_per_second": 8.162,
-    "train_steps_per_second": 0.041
 }

 {
+    "epoch": 39.8,
+    "total_flos": 3.088453228308726e+17,
+    "train_loss": 0.15159874260425568,
+    "train_runtime": 6474.8036,
+    "train_samples_per_second": 1.927,
+    "train_steps_per_second": 0.012
 }

trainer_state.json CHANGED Viewed

@@ -1,397 +1,409 @@
 {
-  "best_metric": 0.9090909090909091,
-  "best_model_checkpoint": "delivery_truck_classification/checkpoint-21",
-  "epoch": 39.57142857142857,
-  "global_step": 40,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
-      "epoch": 0.57,
-      "eval_accuracy": 0.13636363636363635,
-      "eval_loss": 1.9638466835021973,
-      "eval_runtime": 1.6283,
-      "eval_samples_per_second": 13.511,
-      "eval_steps_per_second": 0.614,
-      "step": 1
-    },
-    {
-      "epoch": 1.57,
-      "eval_accuracy": 0.09090909090909091,
-      "eval_loss": 1.9021785259246826,
-      "eval_runtime": 1.7599,
-      "eval_samples_per_second": 12.501,
-      "eval_steps_per_second": 0.568,
       "step": 2
     },
     {
-      "epoch": 2.57,
-      "eval_accuracy": 0.09090909090909091,
-      "eval_loss": 1.7954376935958862,
-      "eval_runtime": 1.7675,
-      "eval_samples_per_second": 12.447,
-      "eval_steps_per_second": 0.566,
-      "step": 3
-    },
-    {
-      "epoch": 3.57,
-      "eval_accuracy": 0.36363636363636365,
-      "eval_loss": 1.646571397781372,
-      "eval_runtime": 1.8048,
-      "eval_samples_per_second": 12.19,
-      "eval_steps_per_second": 0.554,
       "step": 4
     },
     {
-      "epoch": 4.57,
-      "eval_accuracy": 0.5,
-      "eval_loss": 1.516127347946167,
-      "eval_runtime": 1.8376,
-      "eval_samples_per_second": 11.972,
-      "eval_steps_per_second": 0.544,
-      "step": 5
-    },
-    {
-      "epoch": 5.57,
-      "eval_accuracy": 0.5454545454545454,
-      "eval_loss": 1.4261207580566406,
-      "eval_runtime": 1.6096,
-      "eval_samples_per_second": 13.668,
-      "eval_steps_per_second": 0.621,
       "step": 6
     },
     {
-      "epoch": 6.57,
-      "eval_accuracy": 0.5454545454545454,
-      "eval_loss": 1.3546966314315796,
-      "eval_runtime": 1.568,
-      "eval_samples_per_second": 14.03,
-      "eval_steps_per_second": 0.638,
-      "step": 7
-    },
-    {
-      "epoch": 7.57,
-      "eval_accuracy": 0.6363636363636364,
-      "eval_loss": 1.2797943353652954,
-      "eval_runtime": 1.8043,
-      "eval_samples_per_second": 12.193,
-      "eval_steps_per_second": 0.554,
       "step": 8
     },
     {
-      "epoch": 8.57,
-      "eval_accuracy": 0.6363636363636364,
-      "eval_loss": 1.2200274467468262,
-      "eval_runtime": 1.811,
-      "eval_samples_per_second": 12.148,
-      "eval_steps_per_second": 0.552,
-      "step": 9
-    },
-    {
-      "epoch": 9.57,
-      "eval_accuracy": 0.6363636363636364,
-      "eval_loss": 1.1594452857971191,
-      "eval_runtime": 1.803,
-      "eval_samples_per_second": 12.202,
-      "eval_steps_per_second": 0.555,
       "step": 10
     },
     {
-      "epoch": 10.57,
-      "eval_accuracy": 0.6818181818181818,
-      "eval_loss": 1.1154121160507202,
-      "eval_runtime": 1.7747,
-      "eval_samples_per_second": 12.397,
-      "eval_steps_per_second": 0.563,
-      "step": 11
-    },
-    {
-      "epoch": 11.57,
-      "eval_accuracy": 0.6818181818181818,
-      "eval_loss": 1.07809579372406,
-      "eval_runtime": 1.6416,
-      "eval_samples_per_second": 13.401,
-      "eval_steps_per_second": 0.609,
       "step": 12
     },
     {
-      "epoch": 12.57,
-      "eval_accuracy": 0.6818181818181818,
-      "eval_loss": 1.0285967588424683,
-      "eval_runtime": 1.7863,
-      "eval_samples_per_second": 12.316,
-      "eval_steps_per_second": 0.56,
-      "step": 13
-    },
-    {
-      "epoch": 13.57,
-      "eval_accuracy": 0.6818181818181818,
-      "eval_loss": 0.9623335003852844,
-      "eval_runtime": 1.8244,
-      "eval_samples_per_second": 12.059,
-      "eval_steps_per_second": 0.548,
       "step": 14
     },
     {
-      "epoch": 14.57,
-      "eval_accuracy": 0.6818181818181818,
-      "eval_loss": 0.8952316641807556,
-      "eval_runtime": 1.8255,
-      "eval_samples_per_second": 12.052,
-      "eval_steps_per_second": 0.548,
-      "step": 15
-    },
-    {
-      "epoch": 15.57,
-      "eval_accuracy": 0.7272727272727273,
-      "eval_loss": 0.8217518329620361,
-      "eval_runtime": 1.8059,
-      "eval_samples_per_second": 12.182,
-      "eval_steps_per_second": 0.554,
       "step": 16
     },
     {
-      "epoch": 16.57,
-      "eval_accuracy": 0.7727272727272727,
-      "eval_loss": 0.7331055998802185,
-      "eval_runtime": 1.6554,
-      "eval_samples_per_second": 13.29,
-      "eval_steps_per_second": 0.604,
-      "step": 17
-    },
-    {
-      "epoch": 17.57,
-      "eval_accuracy": 0.8181818181818182,
-      "eval_loss": 0.6525326371192932,
-      "eval_runtime": 1.8033,
-      "eval_samples_per_second": 12.2,
-      "eval_steps_per_second": 0.555,
       "step": 18
     },
     {
-      "epoch": 18.57,
-      "eval_accuracy": 0.8636363636363636,
-      "eval_loss": 0.5678051710128784,
-      "eval_runtime": 1.7903,
-      "eval_samples_per_second": 12.288,
-      "eval_steps_per_second": 0.559,
-      "step": 19
-    },
-    {
-      "epoch": 19.57,
-      "learning_rate": 2.777777777777778e-05,
-      "loss": 1.9399,
       "step": 20
     },
     {
-      "epoch": 19.57,
-      "eval_accuracy": 0.8636363636363636,
-      "eval_loss": 0.497961163520813,
-      "eval_runtime": 1.8331,
-      "eval_samples_per_second": 12.002,
-      "eval_steps_per_second": 0.546,
       "step": 20
     },
     {
-      "epoch": 20.57,
-      "eval_accuracy": 0.9090909090909091,
-      "eval_loss": 0.46136438846588135,
-      "eval_runtime": 1.8006,
-      "eval_samples_per_second": 12.218,
-      "eval_steps_per_second": 0.555,
-      "step": 21
-    },
-    {
-      "epoch": 21.57,
-      "eval_accuracy": 0.9090909090909091,
-      "eval_loss": 0.4493587613105774,
-      "eval_runtime": 1.6389,
-      "eval_samples_per_second": 13.424,
-      "eval_steps_per_second": 0.61,
       "step": 22
     },
     {
-      "epoch": 22.57,
-      "eval_accuracy": 0.8181818181818182,
-      "eval_loss": 0.4404635727405548,
-      "eval_runtime": 1.8581,
-      "eval_samples_per_second": 11.84,
-      "eval_steps_per_second": 0.538,
-      "step": 23
-    },
-    {
-      "epoch": 23.57,
-      "eval_accuracy": 0.8636363636363636,
-      "eval_loss": 0.4357987344264984,
-      "eval_runtime": 1.7864,
-      "eval_samples_per_second": 12.315,
-      "eval_steps_per_second": 0.56,
       "step": 24
     },
     {
-      "epoch": 24.57,
-      "eval_accuracy": 0.8636363636363636,
-      "eval_loss": 0.43069612979888916,
-      "eval_runtime": 1.804,
-      "eval_samples_per_second": 12.195,
-      "eval_steps_per_second": 0.554,
-      "step": 25
-    },
-    {
-      "epoch": 25.57,
-      "eval_accuracy": 0.8636363636363636,
-      "eval_loss": 0.4099968671798706,
-      "eval_runtime": 1.7489,
-      "eval_samples_per_second": 12.579,
-      "eval_steps_per_second": 0.572,
       "step": 26
     },
     {
-      "epoch": 26.57,
-      "eval_accuracy": 0.8181818181818182,
-      "eval_loss": 0.3925555944442749,
-      "eval_runtime": 1.6257,
-      "eval_samples_per_second": 13.533,
-      "eval_steps_per_second": 0.615,
-      "step": 27
-    },
-    {
-      "epoch": 27.57,
-      "eval_accuracy": 0.8181818181818182,
-      "eval_loss": 0.3818438649177551,
-      "eval_runtime": 1.8073,
-      "eval_samples_per_second": 12.173,
-      "eval_steps_per_second": 0.553,
       "step": 28
     },
     {
-      "epoch": 28.57,
-      "eval_accuracy": 0.8181818181818182,
-      "eval_loss": 0.366110235452652,
-      "eval_runtime": 1.7879,
-      "eval_samples_per_second": 12.305,
-      "eval_steps_per_second": 0.559,
-      "step": 29
-    },
-    {
-      "epoch": 29.57,
-      "eval_accuracy": 0.8636363636363636,
-      "eval_loss": 0.35147225856781006,
-      "eval_runtime": 1.8109,
-      "eval_samples_per_second": 12.149,
-      "eval_steps_per_second": 0.552,
       "step": 30
     },
     {
-      "epoch": 30.57,
-      "eval_accuracy": 0.8636363636363636,
-      "eval_loss": 0.3345157206058502,
-      "eval_runtime": 1.8479,
-      "eval_samples_per_second": 11.905,
-      "eval_steps_per_second": 0.541,
-      "step": 31
-    },
-    {
-      "epoch": 31.57,
-      "eval_accuracy": 0.8636363636363636,
-      "eval_loss": 0.32043513655662537,
-      "eval_runtime": 1.599,
-      "eval_samples_per_second": 13.759,
-      "eval_steps_per_second": 0.625,
       "step": 32
     },
     {
-      "epoch": 32.57,
-      "eval_accuracy": 0.8636363636363636,
-      "eval_loss": 0.3077632486820221,
-      "eval_runtime": 1.8226,
-      "eval_samples_per_second": 12.071,
-      "eval_steps_per_second": 0.549,
-      "step": 33
-    },
-    {
-      "epoch": 33.57,
-      "eval_accuracy": 0.8636363636363636,
-      "eval_loss": 0.2948474586009979,
-      "eval_runtime": 1.7885,
-      "eval_samples_per_second": 12.301,
-      "eval_steps_per_second": 0.559,
       "step": 34
     },
     {
-      "epoch": 34.57,
-      "eval_accuracy": 0.8636363636363636,
-      "eval_loss": 0.2848185896873474,
-      "eval_runtime": 1.8362,
-      "eval_samples_per_second": 11.981,
-      "eval_steps_per_second": 0.545,
-      "step": 35
-    },
-    {
-      "epoch": 35.57,
-      "eval_accuracy": 0.8636363636363636,
-      "eval_loss": 0.2748388946056366,
-      "eval_runtime": 1.8319,
-      "eval_samples_per_second": 12.009,
-      "eval_steps_per_second": 0.546,
       "step": 36
     },
     {
-      "epoch": 36.57,
-      "eval_accuracy": 0.8636363636363636,
-      "eval_loss": 0.2679346203804016,
-      "eval_runtime": 1.6038,
-      "eval_samples_per_second": 13.718,
-      "eval_steps_per_second": 0.624,
-      "step": 37
-    },
-    {
-      "epoch": 37.57,
-      "eval_accuracy": 0.8636363636363636,
-      "eval_loss": 0.26424679160118103,
-      "eval_runtime": 1.8361,
-      "eval_samples_per_second": 11.982,
-      "eval_steps_per_second": 0.545,
       "step": 38
     },
     {
-      "epoch": 38.57,
-      "eval_accuracy": 0.8636363636363636,
-      "eval_loss": 0.2638870179653168,
-      "eval_runtime": 1.7769,
-      "eval_samples_per_second": 12.381,
-      "eval_steps_per_second": 0.563,
-      "step": 39
-    },
-    {
-      "epoch": 39.57,
-      "learning_rate": 0.0,
-      "loss": 0.728,
       "step": 40
     },
     {
-      "epoch": 39.57,
-      "eval_accuracy": 0.8636363636363636,
-      "eval_loss": 0.26363667845726013,
-      "eval_runtime": 1.7373,
-      "eval_samples_per_second": 12.663,
-      "eval_steps_per_second": 0.576,
       "step": 40
     },
     {
-      "epoch": 39.57,
-      "step": 40,
-      "total_flos": 1.9417183005730406e+17,
-      "train_loss": 1.3339122772216796,
-      "train_runtime": 965.4815,
-      "train_samples_per_second": 8.162,
-      "train_steps_per_second": 0.041
     }
   ],
-  "max_steps": 40,
   "num_train_epochs": 40,
-  "total_flos": 1.9417183005730406e+17,
   "trial_name": null,
   "trial_params": null
 }

 {
+  "best_metric": 0.9714285714285714,
+  "best_model_checkpoint": "delivery_truck_classification\\checkpoint-4",
+  "epoch": 39.8,
+  "global_step": 80,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
+      "epoch": 0.8,
+      "eval_accuracy": 0.9428571428571428,
+      "eval_loss": 0.19194960594177246,
+      "eval_runtime": 8.8411,
+      "eval_samples_per_second": 3.959,
+      "eval_steps_per_second": 0.226,
       "step": 2
     },
     {
+      "epoch": 1.8,
+      "eval_accuracy": 0.9714285714285714,
+      "eval_loss": 0.1382756382226944,
+      "eval_runtime": 7.2367,
+      "eval_samples_per_second": 4.836,
+      "eval_steps_per_second": 0.276,
       "step": 4
     },
     {
+      "epoch": 2.8,
+      "eval_accuracy": 0.9142857142857143,
+      "eval_loss": 0.19303296506404877,
+      "eval_runtime": 7.0677,
+      "eval_samples_per_second": 4.952,
+      "eval_steps_per_second": 0.283,
       "step": 6
     },
     {
+      "epoch": 3.8,
+      "eval_accuracy": 0.9714285714285714,
+      "eval_loss": 0.1462627798318863,
+      "eval_runtime": 7.1631,
+      "eval_samples_per_second": 4.886,
+      "eval_steps_per_second": 0.279,
       "step": 8
     },
     {
+      "epoch": 4.8,
+      "eval_accuracy": 0.9714285714285714,
+      "eval_loss": 0.1735035479068756,
+      "eval_runtime": 6.91,
+      "eval_samples_per_second": 5.065,
+      "eval_steps_per_second": 0.289,
       "step": 10
     },
     {
+      "epoch": 5.8,
+      "eval_accuracy": 0.9714285714285714,
+      "eval_loss": 0.1692284345626831,
+      "eval_runtime": 6.8605,
+      "eval_samples_per_second": 5.102,
+      "eval_steps_per_second": 0.292,
       "step": 12
     },
     {
+      "epoch": 6.8,
+      "eval_accuracy": 0.9714285714285714,
+      "eval_loss": 0.1626075655221939,
+      "eval_runtime": 6.8284,
+      "eval_samples_per_second": 5.126,
+      "eval_steps_per_second": 0.293,
       "step": 14
     },
     {
+      "epoch": 7.8,
+      "eval_accuracy": 0.9714285714285714,
+      "eval_loss": 0.16586509346961975,
+      "eval_runtime": 6.3075,
+      "eval_samples_per_second": 5.549,
+      "eval_steps_per_second": 0.317,
       "step": 16
     },
     {
+      "epoch": 8.8,
+      "eval_accuracy": 0.9714285714285714,
+      "eval_loss": 0.1622493714094162,
+      "eval_runtime": 6.8493,
+      "eval_samples_per_second": 5.11,
+      "eval_steps_per_second": 0.292,
       "step": 18
     },
     {
+      "epoch": 9.8,
+      "learning_rate": 4.166666666666667e-05,
+      "loss": 0.2046,
       "step": 20
     },
     {
+      "epoch": 9.8,
+      "eval_accuracy": 0.9714285714285714,
+      "eval_loss": 0.1598205715417862,
+      "eval_runtime": 6.8584,
+      "eval_samples_per_second": 5.103,
+      "eval_steps_per_second": 0.292,
       "step": 20
     },
     {
+      "epoch": 10.8,
+      "eval_accuracy": 0.9714285714285714,
+      "eval_loss": 0.16681121289730072,
+      "eval_runtime": 7.2746,
+      "eval_samples_per_second": 4.811,
+      "eval_steps_per_second": 0.275,
       "step": 22
     },
     {
+      "epoch": 11.8,
+      "eval_accuracy": 0.9714285714285714,
+      "eval_loss": 0.1746995747089386,
+      "eval_runtime": 7.1258,
+      "eval_samples_per_second": 4.912,
+      "eval_steps_per_second": 0.281,
       "step": 24
     },
     {
+      "epoch": 12.8,
+      "eval_accuracy": 0.9714285714285714,
+      "eval_loss": 0.18037545680999756,
+      "eval_runtime": 6.9863,
+      "eval_samples_per_second": 5.01,
+      "eval_steps_per_second": 0.286,
       "step": 26
     },
     {
+      "epoch": 13.8,
+      "eval_accuracy": 0.9714285714285714,
+      "eval_loss": 0.18370455503463745,
+      "eval_runtime": 6.1139,
+      "eval_samples_per_second": 5.725,
+      "eval_steps_per_second": 0.327,
       "step": 28
     },
     {
+      "epoch": 14.8,
+      "eval_accuracy": 0.9714285714285714,
+      "eval_loss": 0.1837157905101776,
+      "eval_runtime": 6.7444,
+      "eval_samples_per_second": 5.189,
+      "eval_steps_per_second": 0.297,
       "step": 30
     },
     {
+      "epoch": 15.8,
+      "eval_accuracy": 0.9714285714285714,
+      "eval_loss": 0.18111634254455566,
+      "eval_runtime": 7.0847,
+      "eval_samples_per_second": 4.94,
+      "eval_steps_per_second": 0.282,
       "step": 32
     },
     {
+      "epoch": 16.8,
+      "eval_accuracy": 0.9714285714285714,
+      "eval_loss": 0.18009454011917114,
+      "eval_runtime": 6.8211,
+      "eval_samples_per_second": 5.131,
+      "eval_steps_per_second": 0.293,
       "step": 34
     },
     {
+      "epoch": 17.8,
+      "eval_accuracy": 0.9714285714285714,
+      "eval_loss": 0.18408751487731934,
+      "eval_runtime": 6.9341,
+      "eval_samples_per_second": 5.048,
+      "eval_steps_per_second": 0.288,
       "step": 36
     },
     {
+      "epoch": 18.8,
+      "eval_accuracy": 0.9714285714285714,
+      "eval_loss": 0.1899442970752716,
+      "eval_runtime": 7.0358,
+      "eval_samples_per_second": 4.975,
+      "eval_steps_per_second": 0.284,
       "step": 38
     },
     {
+      "epoch": 19.8,
+      "learning_rate": 2.777777777777778e-05,
+      "loss": 0.1657,
       "step": 40
     },
     {
+      "epoch": 19.8,
+      "eval_accuracy": 0.9714285714285714,
+      "eval_loss": 0.19598019123077393,
+      "eval_runtime": 7.9601,
+      "eval_samples_per_second": 4.397,
+      "eval_steps_per_second": 0.251,
       "step": 40
     },
     {
+      "epoch": 20.8,
+      "eval_accuracy": 0.9714285714285714,
+      "eval_loss": 0.19925238192081451,
+      "eval_runtime": 7.4131,
+      "eval_samples_per_second": 4.721,
+      "eval_steps_per_second": 0.27,
+      "step": 42
+    },
+    {
+      "epoch": 21.8,
+      "eval_accuracy": 0.9714285714285714,
+      "eval_loss": 0.20172713696956635,
+      "eval_runtime": 6.7891,
+      "eval_samples_per_second": 5.155,
+      "eval_steps_per_second": 0.295,
+      "step": 44
+    },
+    {
+      "epoch": 22.8,
+      "eval_accuracy": 0.9714285714285714,
+      "eval_loss": 0.2004331350326538,
+      "eval_runtime": 6.2296,
+      "eval_samples_per_second": 5.618,
+      "eval_steps_per_second": 0.321,
+      "step": 46
+    },
+    {
+      "epoch": 23.8,
+      "eval_accuracy": 0.9714285714285714,
+      "eval_loss": 0.19216616451740265,
+      "eval_runtime": 7.0857,
+      "eval_samples_per_second": 4.94,
+      "eval_steps_per_second": 0.282,
+      "step": 48
+    },
+    {
+      "epoch": 24.8,
+      "eval_accuracy": 0.9714285714285714,
+      "eval_loss": 0.18559373915195465,
+      "eval_runtime": 7.3612,
+      "eval_samples_per_second": 4.755,
+      "eval_steps_per_second": 0.272,
+      "step": 50
+    },
+    {
+      "epoch": 25.8,
+      "eval_accuracy": 0.9714285714285714,
+      "eval_loss": 0.18343603610992432,
+      "eval_runtime": 6.8088,
+      "eval_samples_per_second": 5.14,
+      "eval_steps_per_second": 0.294,
+      "step": 52
+    },
+    {
+      "epoch": 26.8,
+      "eval_accuracy": 0.9714285714285714,
+      "eval_loss": 0.18461596965789795,
+      "eval_runtime": 6.6873,
+      "eval_samples_per_second": 5.234,
+      "eval_steps_per_second": 0.299,
+      "step": 54
+    },
+    {
+      "epoch": 27.8,
+      "eval_accuracy": 0.9714285714285714,
+      "eval_loss": 0.18977026641368866,
+      "eval_runtime": 6.826,
+      "eval_samples_per_second": 5.127,
+      "eval_steps_per_second": 0.293,
+      "step": 56
+    },
+    {
+      "epoch": 28.8,
+      "eval_accuracy": 0.9714285714285714,
+      "eval_loss": 0.1951347291469574,
+      "eval_runtime": 6.8913,
+      "eval_samples_per_second": 5.079,
+      "eval_steps_per_second": 0.29,
+      "step": 58
+    },
+    {
+      "epoch": 29.8,
+      "learning_rate": 1.388888888888889e-05,
+      "loss": 0.1308,
+      "step": 60
+    },
+    {
+      "epoch": 29.8,
+      "eval_accuracy": 0.9714285714285714,
+      "eval_loss": 0.20185869932174683,
+      "eval_runtime": 6.8601,
+      "eval_samples_per_second": 5.102,
+      "eval_steps_per_second": 0.292,
+      "step": 60
+    },
+    {
+      "epoch": 30.8,
+      "eval_accuracy": 0.9714285714285714,
+      "eval_loss": 0.2095019370317459,
+      "eval_runtime": 7.2055,
+      "eval_samples_per_second": 4.857,
+      "eval_steps_per_second": 0.278,
+      "step": 62
+    },
+    {
+      "epoch": 31.8,
+      "eval_accuracy": 0.9714285714285714,
+      "eval_loss": 0.21445579826831818,
+      "eval_runtime": 7.4924,
+      "eval_samples_per_second": 4.671,
+      "eval_steps_per_second": 0.267,
+      "step": 64
+    },
+    {
+      "epoch": 32.8,
+      "eval_accuracy": 0.9714285714285714,
+      "eval_loss": 0.21541449427604675,
+      "eval_runtime": 6.8812,
+      "eval_samples_per_second": 5.086,
+      "eval_steps_per_second": 0.291,
+      "step": 66
+    },
+    {
+      "epoch": 33.8,
+      "eval_accuracy": 0.9714285714285714,
+      "eval_loss": 0.21372175216674805,
+      "eval_runtime": 6.9147,
+      "eval_samples_per_second": 5.062,
+      "eval_steps_per_second": 0.289,
+      "step": 68
+    },
+    {
+      "epoch": 34.8,
+      "eval_accuracy": 0.9714285714285714,
+      "eval_loss": 0.2116171419620514,
+      "eval_runtime": 7.0628,
+      "eval_samples_per_second": 4.956,
+      "eval_steps_per_second": 0.283,
+      "step": 70
+    },
+    {
+      "epoch": 35.8,
+      "eval_accuracy": 0.9714285714285714,
+      "eval_loss": 0.20960116386413574,
+      "eval_runtime": 7.1202,
+      "eval_samples_per_second": 4.916,
+      "eval_steps_per_second": 0.281,
+      "step": 72
+    },
+    {
+      "epoch": 36.8,
+      "eval_accuracy": 0.9714285714285714,
+      "eval_loss": 0.20841823518276215,
+      "eval_runtime": 7.1749,
+      "eval_samples_per_second": 4.878,
+      "eval_steps_per_second": 0.279,
+      "step": 74
+    },
+    {
+      "epoch": 37.8,
+      "eval_accuracy": 0.9714285714285714,
+      "eval_loss": 0.20780029892921448,
+      "eval_runtime": 6.9083,
+      "eval_samples_per_second": 5.066,
+      "eval_steps_per_second": 0.29,
+      "step": 76
+    },
+    {
+      "epoch": 38.8,
+      "eval_accuracy": 0.9714285714285714,
+      "eval_loss": 0.2074960172176361,
+      "eval_runtime": 6.9495,
+      "eval_samples_per_second": 5.036,
+      "eval_steps_per_second": 0.288,
+      "step": 78
+    },
+    {
+      "epoch": 39.8,
+      "learning_rate": 0.0,
+      "loss": 0.1053,
+      "step": 80
+    },
+    {
+      "epoch": 39.8,
+      "eval_accuracy": 0.9714285714285714,
+      "eval_loss": 0.20739802718162537,
+      "eval_runtime": 6.9547,
+      "eval_samples_per_second": 5.033,
+      "eval_steps_per_second": 0.288,
+      "step": 80
+    },
+    {
+      "epoch": 39.8,
+      "step": 80,
+      "total_flos": 3.088453228308726e+17,
+      "train_loss": 0.15159874260425568,
+      "train_runtime": 6474.8036,
+      "train_samples_per_second": 1.927,
+      "train_steps_per_second": 0.012
     }
   ],
+  "max_steps": 80,
   "num_train_epochs": 40,
+  "total_flos": 3.088453228308726e+17,
   "trial_name": null,
   "trial_params": null
 }