End of training

Browse files

Files changed (5) hide show

all_results.json +11 -11
eval_results.json +6 -6
runs/Sep08_11-09-55_9916cc61b3ca/events.out.tfevents.1662636601.9916cc61b3ca.70.2 +3 -0
train_results.json +6 -6
trainer_state.json +254 -254

all_results.json CHANGED Viewed

@@ -1,13 +1,13 @@
 {
-    "epoch": 39.67,
-    "eval_accuracy": 1.0,
-    "eval_loss": 0.5916178226470947,
-    "eval_runtime": 1.6168,
-    "eval_samples_per_second": 13.607,
-    "eval_steps_per_second": 0.619,
-    "total_flos": 1.893243704668324e+17,
-    "train_loss": 1.1570292234420776,
-    "train_runtime": 934.4965,
-    "train_samples_per_second": 8.218,
-    "train_steps_per_second": 0.043
 }

 {
+    "epoch": 39.57,
+    "eval_accuracy": 0.9090909090909091,
+    "eval_loss": 0.46136438846588135,
+    "eval_runtime": 1.7026,
+    "eval_samples_per_second": 12.921,
+    "eval_steps_per_second": 0.587,
+    "total_flos": 1.9417183005730406e+17,
+    "train_loss": 1.3339122772216796,
+    "train_runtime": 965.4815,
+    "train_samples_per_second": 8.162,
+    "train_steps_per_second": 0.041
 }

eval_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
-    "epoch": 39.67,
-    "eval_accuracy": 1.0,
-    "eval_loss": 0.5916178226470947,
-    "eval_runtime": 1.6168,
-    "eval_samples_per_second": 13.607,
-    "eval_steps_per_second": 0.619
 }

 {
+    "epoch": 39.57,
+    "eval_accuracy": 0.9090909090909091,
+    "eval_loss": 0.46136438846588135,
+    "eval_runtime": 1.7026,
+    "eval_samples_per_second": 12.921,
+    "eval_steps_per_second": 0.587
 }

runs/Sep08_11-09-55_9916cc61b3ca/events.out.tfevents.1662636601.9916cc61b3ca.70.2 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9aedf680300539d244a53244ff8c543ab2aea5a73d309d5630c6f8a7e2ee7874
+size 357

train_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
-    "epoch": 39.67,
-    "total_flos": 1.893243704668324e+17,
-    "train_loss": 1.1570292234420776,
-    "train_runtime": 934.4965,
-    "train_samples_per_second": 8.218,
-    "train_steps_per_second": 0.043
 }

 {
+    "epoch": 39.57,
+    "total_flos": 1.9417183005730406e+17,
+    "train_loss": 1.3339122772216796,
+    "train_runtime": 965.4815,
+    "train_samples_per_second": 8.162,
+    "train_steps_per_second": 0.041
 }

trainer_state.json CHANGED Viewed

@@ -1,397 +1,397 @@
 {
-  "best_metric": 1.0,
-  "best_model_checkpoint": "delivery_truck_classification/checkpoint-13",
-  "epoch": 39.666666666666664,
   "global_step": 40,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
-      "epoch": 0.67,
-      "eval_accuracy": 0.18181818181818182,
-      "eval_loss": 1.868780255317688,
-      "eval_runtime": 1.5131,
-      "eval_samples_per_second": 14.54,
-      "eval_steps_per_second": 0.661,
       "step": 1
     },
     {
-      "epoch": 1.67,
-      "eval_accuracy": 0.18181818181818182,
-      "eval_loss": 1.7919577360153198,
-      "eval_runtime": 1.7289,
-      "eval_samples_per_second": 12.725,
-      "eval_steps_per_second": 0.578,
       "step": 2
     },
     {
-      "epoch": 2.67,
-      "eval_accuracy": 0.36363636363636365,
-      "eval_loss": 1.6533408164978027,
-      "eval_runtime": 1.6458,
-      "eval_samples_per_second": 13.368,
-      "eval_steps_per_second": 0.608,
       "step": 3
     },
     {
-      "epoch": 3.67,
-      "eval_accuracy": 0.45454545454545453,
-      "eval_loss": 1.4775406122207642,
-      "eval_runtime": 1.6663,
-      "eval_samples_per_second": 13.203,
-      "eval_steps_per_second": 0.6,
       "step": 4
     },
     {
-      "epoch": 4.67,
-      "eval_accuracy": 0.5909090909090909,
-      "eval_loss": 1.2912439107894897,
-      "eval_runtime": 1.6991,
-      "eval_samples_per_second": 12.948,
-      "eval_steps_per_second": 0.589,
       "step": 5
     },
     {
-      "epoch": 5.67,
-      "eval_accuracy": 0.7272727272727273,
-      "eval_loss": 1.147495150566101,
-      "eval_runtime": 1.713,
-      "eval_samples_per_second": 12.843,
-      "eval_steps_per_second": 0.584,
       "step": 6
     },
     {
-      "epoch": 6.67,
-      "eval_accuracy": 0.7727272727272727,
-      "eval_loss": 1.0265945196151733,
-      "eval_runtime": 1.5543,
-      "eval_samples_per_second": 14.154,
-      "eval_steps_per_second": 0.643,
       "step": 7
     },
     {
-      "epoch": 7.67,
-      "eval_accuracy": 0.7727272727272727,
-      "eval_loss": 0.9196190237998962,
-      "eval_runtime": 1.677,
-      "eval_samples_per_second": 13.119,
-      "eval_steps_per_second": 0.596,
       "step": 8
     },
     {
-      "epoch": 8.67,
-      "eval_accuracy": 0.8181818181818182,
-      "eval_loss": 0.8272687792778015,
-      "eval_runtime": 1.7098,
-      "eval_samples_per_second": 12.867,
-      "eval_steps_per_second": 0.585,
       "step": 9
     },
     {
-      "epoch": 9.67,
-      "eval_accuracy": 0.8181818181818182,
-      "eval_loss": 0.7491626739501953,
-      "eval_runtime": 1.6687,
-      "eval_samples_per_second": 13.184,
-      "eval_steps_per_second": 0.599,
       "step": 10
     },
     {
-      "epoch": 10.67,
-      "eval_accuracy": 0.9090909090909091,
-      "eval_loss": 0.6857182383537292,
-      "eval_runtime": 1.6621,
-      "eval_samples_per_second": 13.236,
-      "eval_steps_per_second": 0.602,
       "step": 11
     },
     {
-      "epoch": 11.67,
-      "eval_accuracy": 0.9090909090909091,
-      "eval_loss": 0.6368551850318909,
-      "eval_runtime": 1.555,
-      "eval_samples_per_second": 14.148,
-      "eval_steps_per_second": 0.643,
       "step": 12
     },
     {
-      "epoch": 12.67,
-      "eval_accuracy": 1.0,
-      "eval_loss": 0.5916178226470947,
-      "eval_runtime": 1.5463,
-      "eval_samples_per_second": 14.227,
-      "eval_steps_per_second": 0.647,
       "step": 13
     },
     {
-      "epoch": 13.67,
-      "eval_accuracy": 1.0,
-      "eval_loss": 0.5461986660957336,
-      "eval_runtime": 1.751,
-      "eval_samples_per_second": 12.564,
-      "eval_steps_per_second": 0.571,
       "step": 14
     },
     {
-      "epoch": 14.67,
-      "eval_accuracy": 1.0,
-      "eval_loss": 0.4926997423171997,
-      "eval_runtime": 1.6672,
-      "eval_samples_per_second": 13.196,
-      "eval_steps_per_second": 0.6,
       "step": 15
     },
     {
-      "epoch": 15.67,
-      "eval_accuracy": 1.0,
-      "eval_loss": 0.4390135705471039,
-      "eval_runtime": 1.6819,
-      "eval_samples_per_second": 13.08,
-      "eval_steps_per_second": 0.595,
       "step": 16
     },
     {
-      "epoch": 16.67,
-      "eval_accuracy": 1.0,
-      "eval_loss": 0.3913687765598297,
-      "eval_runtime": 1.7338,
-      "eval_samples_per_second": 12.689,
-      "eval_steps_per_second": 0.577,
       "step": 17
     },
     {
-      "epoch": 17.67,
-      "eval_accuracy": 1.0,
-      "eval_loss": 0.3446086645126343,
-      "eval_runtime": 1.6759,
-      "eval_samples_per_second": 13.127,
-      "eval_steps_per_second": 0.597,
       "step": 18
     },
     {
-      "epoch": 18.67,
-      "eval_accuracy": 1.0,
-      "eval_loss": 0.30193081498146057,
-      "eval_runtime": 1.53,
-      "eval_samples_per_second": 14.379,
-      "eval_steps_per_second": 0.654,
       "step": 19
     },
     {
-      "epoch": 19.67,
       "learning_rate": 2.777777777777778e-05,
-      "loss": 1.7058,
       "step": 20
     },
     {
-      "epoch": 19.67,
-      "eval_accuracy": 1.0,
-      "eval_loss": 0.26113784313201904,
-      "eval_runtime": 1.6899,
-      "eval_samples_per_second": 13.018,
-      "eval_steps_per_second": 0.592,
       "step": 20
     },
     {
-      "epoch": 20.67,
-      "eval_accuracy": 1.0,
-      "eval_loss": 0.22893615067005157,
-      "eval_runtime": 1.6979,
-      "eval_samples_per_second": 12.957,
-      "eval_steps_per_second": 0.589,
       "step": 21
     },
     {
-      "epoch": 21.67,
-      "eval_accuracy": 1.0,
-      "eval_loss": 0.19601884484291077,
-      "eval_runtime": 1.7011,
-      "eval_samples_per_second": 12.933,
-      "eval_steps_per_second": 0.588,
       "step": 22
     },
     {
-      "epoch": 22.67,
-      "eval_accuracy": 1.0,
-      "eval_loss": 0.17112015187740326,
-      "eval_runtime": 1.7223,
-      "eval_samples_per_second": 12.774,
-      "eval_steps_per_second": 0.581,
       "step": 23
     },
     {
-      "epoch": 23.67,
-      "eval_accuracy": 1.0,
-      "eval_loss": 0.1567678302526474,
-      "eval_runtime": 1.7218,
-      "eval_samples_per_second": 12.778,
-      "eval_steps_per_second": 0.581,
       "step": 24
     },
     {
-      "epoch": 24.67,
-      "eval_accuracy": 1.0,
-      "eval_loss": 0.14628903567790985,
-      "eval_runtime": 1.5212,
-      "eval_samples_per_second": 14.462,
-      "eval_steps_per_second": 0.657,
       "step": 25
     },
     {
-      "epoch": 25.67,
-      "eval_accuracy": 1.0,
-      "eval_loss": 0.13830214738845825,
-      "eval_runtime": 1.7359,
-      "eval_samples_per_second": 12.673,
-      "eval_steps_per_second": 0.576,
       "step": 26
     },
     {
-      "epoch": 26.67,
-      "eval_accuracy": 1.0,
-      "eval_loss": 0.13232018053531647,
-      "eval_runtime": 1.6428,
-      "eval_samples_per_second": 13.392,
-      "eval_steps_per_second": 0.609,
       "step": 27
     },
     {
-      "epoch": 27.67,
-      "eval_accuracy": 1.0,
-      "eval_loss": 0.12681324779987335,
-      "eval_runtime": 2.2983,
-      "eval_samples_per_second": 9.572,
-      "eval_steps_per_second": 0.435,
       "step": 28
     },
     {
-      "epoch": 28.67,
-      "eval_accuracy": 1.0,
-      "eval_loss": 0.1198858991265297,
-      "eval_runtime": 1.6718,
-      "eval_samples_per_second": 13.16,
-      "eval_steps_per_second": 0.598,
       "step": 29
     },
     {
-      "epoch": 29.67,
-      "eval_accuracy": 1.0,
-      "eval_loss": 0.11446233093738556,
-      "eval_runtime": 1.6684,
-      "eval_samples_per_second": 13.186,
-      "eval_steps_per_second": 0.599,
       "step": 30
     },
     {
-      "epoch": 30.67,
-      "eval_accuracy": 1.0,
-      "eval_loss": 0.11288688331842422,
-      "eval_runtime": 1.5105,
-      "eval_samples_per_second": 14.565,
-      "eval_steps_per_second": 0.662,
       "step": 31
     },
     {
-      "epoch": 31.67,
-      "eval_accuracy": 1.0,
-      "eval_loss": 0.10953269153833389,
-      "eval_runtime": 1.7039,
-      "eval_samples_per_second": 12.911,
-      "eval_steps_per_second": 0.587,
       "step": 32
     },
     {
-      "epoch": 32.67,
-      "eval_accuracy": 1.0,
-      "eval_loss": 0.10787732154130936,
-      "eval_runtime": 1.7185,
-      "eval_samples_per_second": 12.802,
-      "eval_steps_per_second": 0.582,
       "step": 33
     },
     {
-      "epoch": 33.67,
-      "eval_accuracy": 1.0,
-      "eval_loss": 0.10531877726316452,
-      "eval_runtime": 1.8305,
-      "eval_samples_per_second": 12.019,
-      "eval_steps_per_second": 0.546,
       "step": 34
     },
     {
-      "epoch": 34.67,
-      "eval_accuracy": 1.0,
-      "eval_loss": 0.10338964313268661,
-      "eval_runtime": 1.6703,
-      "eval_samples_per_second": 13.171,
-      "eval_steps_per_second": 0.599,
       "step": 35
     },
     {
-      "epoch": 35.67,
-      "eval_accuracy": 1.0,
-      "eval_loss": 0.09904544055461884,
-      "eval_runtime": 1.5401,
-      "eval_samples_per_second": 14.285,
-      "eval_steps_per_second": 0.649,
       "step": 36
     },
     {
-      "epoch": 36.67,
-      "eval_accuracy": 1.0,
-      "eval_loss": 0.09628929942846298,
-      "eval_runtime": 1.5486,
-      "eval_samples_per_second": 14.206,
-      "eval_steps_per_second": 0.646,
       "step": 37
     },
     {
-      "epoch": 37.67,
-      "eval_accuracy": 1.0,
-      "eval_loss": 0.09520366042852402,
-      "eval_runtime": 1.6769,
-      "eval_samples_per_second": 13.12,
-      "eval_steps_per_second": 0.596,
       "step": 38
     },
     {
-      "epoch": 38.67,
-      "eval_accuracy": 1.0,
-      "eval_loss": 0.09436272829771042,
-      "eval_runtime": 1.7152,
-      "eval_samples_per_second": 12.826,
-      "eval_steps_per_second": 0.583,
       "step": 39
     },
     {
-      "epoch": 39.67,
       "learning_rate": 0.0,
-      "loss": 0.6083,
       "step": 40
     },
     {
-      "epoch": 39.67,
-      "eval_accuracy": 1.0,
-      "eval_loss": 0.0941963642835617,
-      "eval_runtime": 1.7089,
-      "eval_samples_per_second": 12.874,
-      "eval_steps_per_second": 0.585,
       "step": 40
     },
     {
-      "epoch": 39.67,
       "step": 40,
-      "total_flos": 1.893243704668324e+17,
-      "train_loss": 1.1570292234420776,
-      "train_runtime": 934.4965,
-      "train_samples_per_second": 8.218,
-      "train_steps_per_second": 0.043
     }
   ],
   "max_steps": 40,
   "num_train_epochs": 40,
-  "total_flos": 1.893243704668324e+17,
   "trial_name": null,
   "trial_params": null
 }

 {
+  "best_metric": 0.9090909090909091,
+  "best_model_checkpoint": "delivery_truck_classification/checkpoint-21",
+  "epoch": 39.57142857142857,
   "global_step": 40,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
+      "epoch": 0.57,
+      "eval_accuracy": 0.13636363636363635,
+      "eval_loss": 1.9638466835021973,
+      "eval_runtime": 1.6283,
+      "eval_samples_per_second": 13.511,
+      "eval_steps_per_second": 0.614,
       "step": 1
     },
     {
+      "epoch": 1.57,
+      "eval_accuracy": 0.09090909090909091,
+      "eval_loss": 1.9021785259246826,
+      "eval_runtime": 1.7599,
+      "eval_samples_per_second": 12.501,
+      "eval_steps_per_second": 0.568,
       "step": 2
     },
     {
+      "epoch": 2.57,
+      "eval_accuracy": 0.09090909090909091,
+      "eval_loss": 1.7954376935958862,
+      "eval_runtime": 1.7675,
+      "eval_samples_per_second": 12.447,
+      "eval_steps_per_second": 0.566,
       "step": 3
     },
     {
+      "epoch": 3.57,
+      "eval_accuracy": 0.36363636363636365,
+      "eval_loss": 1.646571397781372,
+      "eval_runtime": 1.8048,
+      "eval_samples_per_second": 12.19,
+      "eval_steps_per_second": 0.554,
       "step": 4
     },
     {
+      "epoch": 4.57,
+      "eval_accuracy": 0.5,
+      "eval_loss": 1.516127347946167,
+      "eval_runtime": 1.8376,
+      "eval_samples_per_second": 11.972,
+      "eval_steps_per_second": 0.544,
       "step": 5
     },
     {
+      "epoch": 5.57,
+      "eval_accuracy": 0.5454545454545454,
+      "eval_loss": 1.4261207580566406,
+      "eval_runtime": 1.6096,
+      "eval_samples_per_second": 13.668,
+      "eval_steps_per_second": 0.621,
       "step": 6
     },
     {
+      "epoch": 6.57,
+      "eval_accuracy": 0.5454545454545454,
+      "eval_loss": 1.3546966314315796,
+      "eval_runtime": 1.568,
+      "eval_samples_per_second": 14.03,
+      "eval_steps_per_second": 0.638,
       "step": 7
     },
     {
+      "epoch": 7.57,
+      "eval_accuracy": 0.6363636363636364,
+      "eval_loss": 1.2797943353652954,
+      "eval_runtime": 1.8043,
+      "eval_samples_per_second": 12.193,
+      "eval_steps_per_second": 0.554,
       "step": 8
     },
     {
+      "epoch": 8.57,
+      "eval_accuracy": 0.6363636363636364,
+      "eval_loss": 1.2200274467468262,
+      "eval_runtime": 1.811,
+      "eval_samples_per_second": 12.148,
+      "eval_steps_per_second": 0.552,
       "step": 9
     },
     {
+      "epoch": 9.57,
+      "eval_accuracy": 0.6363636363636364,
+      "eval_loss": 1.1594452857971191,
+      "eval_runtime": 1.803,
+      "eval_samples_per_second": 12.202,
+      "eval_steps_per_second": 0.555,
       "step": 10
     },
     {
+      "epoch": 10.57,
+      "eval_accuracy": 0.6818181818181818,
+      "eval_loss": 1.1154121160507202,
+      "eval_runtime": 1.7747,
+      "eval_samples_per_second": 12.397,
+      "eval_steps_per_second": 0.563,
       "step": 11
     },
     {
+      "epoch": 11.57,
+      "eval_accuracy": 0.6818181818181818,
+      "eval_loss": 1.07809579372406,
+      "eval_runtime": 1.6416,
+      "eval_samples_per_second": 13.401,
+      "eval_steps_per_second": 0.609,
       "step": 12
     },
     {
+      "epoch": 12.57,
+      "eval_accuracy": 0.6818181818181818,
+      "eval_loss": 1.0285967588424683,
+      "eval_runtime": 1.7863,
+      "eval_samples_per_second": 12.316,
+      "eval_steps_per_second": 0.56,
       "step": 13
     },
     {
+      "epoch": 13.57,
+      "eval_accuracy": 0.6818181818181818,
+      "eval_loss": 0.9623335003852844,
+      "eval_runtime": 1.8244,
+      "eval_samples_per_second": 12.059,
+      "eval_steps_per_second": 0.548,
       "step": 14
     },
     {
+      "epoch": 14.57,
+      "eval_accuracy": 0.6818181818181818,
+      "eval_loss": 0.8952316641807556,
+      "eval_runtime": 1.8255,
+      "eval_samples_per_second": 12.052,
+      "eval_steps_per_second": 0.548,
       "step": 15
     },
     {
+      "epoch": 15.57,
+      "eval_accuracy": 0.7272727272727273,
+      "eval_loss": 0.8217518329620361,
+      "eval_runtime": 1.8059,
+      "eval_samples_per_second": 12.182,
+      "eval_steps_per_second": 0.554,
       "step": 16
     },
     {
+      "epoch": 16.57,
+      "eval_accuracy": 0.7727272727272727,
+      "eval_loss": 0.7331055998802185,
+      "eval_runtime": 1.6554,
+      "eval_samples_per_second": 13.29,
+      "eval_steps_per_second": 0.604,
       "step": 17
     },
     {
+      "epoch": 17.57,
+      "eval_accuracy": 0.8181818181818182,
+      "eval_loss": 0.6525326371192932,
+      "eval_runtime": 1.8033,
+      "eval_samples_per_second": 12.2,
+      "eval_steps_per_second": 0.555,
       "step": 18
     },
     {
+      "epoch": 18.57,
+      "eval_accuracy": 0.8636363636363636,
+      "eval_loss": 0.5678051710128784,
+      "eval_runtime": 1.7903,
+      "eval_samples_per_second": 12.288,
+      "eval_steps_per_second": 0.559,
       "step": 19
     },
     {
+      "epoch": 19.57,
       "learning_rate": 2.777777777777778e-05,
+      "loss": 1.9399,
       "step": 20
     },
     {
+      "epoch": 19.57,
+      "eval_accuracy": 0.8636363636363636,
+      "eval_loss": 0.497961163520813,
+      "eval_runtime": 1.8331,
+      "eval_samples_per_second": 12.002,
+      "eval_steps_per_second": 0.546,
       "step": 20
     },
     {
+      "epoch": 20.57,
+      "eval_accuracy": 0.9090909090909091,
+      "eval_loss": 0.46136438846588135,
+      "eval_runtime": 1.8006,
+      "eval_samples_per_second": 12.218,
+      "eval_steps_per_second": 0.555,
       "step": 21
     },
     {
+      "epoch": 21.57,
+      "eval_accuracy": 0.9090909090909091,
+      "eval_loss": 0.4493587613105774,
+      "eval_runtime": 1.6389,
+      "eval_samples_per_second": 13.424,
+      "eval_steps_per_second": 0.61,
       "step": 22
     },
     {
+      "epoch": 22.57,
+      "eval_accuracy": 0.8181818181818182,
+      "eval_loss": 0.4404635727405548,
+      "eval_runtime": 1.8581,
+      "eval_samples_per_second": 11.84,
+      "eval_steps_per_second": 0.538,
       "step": 23
     },
     {
+      "epoch": 23.57,
+      "eval_accuracy": 0.8636363636363636,
+      "eval_loss": 0.4357987344264984,
+      "eval_runtime": 1.7864,
+      "eval_samples_per_second": 12.315,
+      "eval_steps_per_second": 0.56,
       "step": 24
     },
     {
+      "epoch": 24.57,
+      "eval_accuracy": 0.8636363636363636,
+      "eval_loss": 0.43069612979888916,
+      "eval_runtime": 1.804,
+      "eval_samples_per_second": 12.195,
+      "eval_steps_per_second": 0.554,
       "step": 25
     },
     {
+      "epoch": 25.57,
+      "eval_accuracy": 0.8636363636363636,
+      "eval_loss": 0.4099968671798706,
+      "eval_runtime": 1.7489,
+      "eval_samples_per_second": 12.579,
+      "eval_steps_per_second": 0.572,
       "step": 26
     },
     {
+      "epoch": 26.57,
+      "eval_accuracy": 0.8181818181818182,
+      "eval_loss": 0.3925555944442749,
+      "eval_runtime": 1.6257,
+      "eval_samples_per_second": 13.533,
+      "eval_steps_per_second": 0.615,
       "step": 27
     },
     {
+      "epoch": 27.57,
+      "eval_accuracy": 0.8181818181818182,
+      "eval_loss": 0.3818438649177551,
+      "eval_runtime": 1.8073,
+      "eval_samples_per_second": 12.173,
+      "eval_steps_per_second": 0.553,
       "step": 28
     },
     {
+      "epoch": 28.57,
+      "eval_accuracy": 0.8181818181818182,
+      "eval_loss": 0.366110235452652,
+      "eval_runtime": 1.7879,
+      "eval_samples_per_second": 12.305,
+      "eval_steps_per_second": 0.559,
       "step": 29
     },
     {
+      "epoch": 29.57,
+      "eval_accuracy": 0.8636363636363636,
+      "eval_loss": 0.35147225856781006,
+      "eval_runtime": 1.8109,
+      "eval_samples_per_second": 12.149,
+      "eval_steps_per_second": 0.552,
       "step": 30
     },
     {
+      "epoch": 30.57,
+      "eval_accuracy": 0.8636363636363636,
+      "eval_loss": 0.3345157206058502,
+      "eval_runtime": 1.8479,
+      "eval_samples_per_second": 11.905,
+      "eval_steps_per_second": 0.541,
       "step": 31
     },
     {
+      "epoch": 31.57,
+      "eval_accuracy": 0.8636363636363636,
+      "eval_loss": 0.32043513655662537,
+      "eval_runtime": 1.599,
+      "eval_samples_per_second": 13.759,
+      "eval_steps_per_second": 0.625,
       "step": 32
     },
     {
+      "epoch": 32.57,
+      "eval_accuracy": 0.8636363636363636,
+      "eval_loss": 0.3077632486820221,
+      "eval_runtime": 1.8226,
+      "eval_samples_per_second": 12.071,
+      "eval_steps_per_second": 0.549,
       "step": 33
     },
     {
+      "epoch": 33.57,
+      "eval_accuracy": 0.8636363636363636,
+      "eval_loss": 0.2948474586009979,
+      "eval_runtime": 1.7885,
+      "eval_samples_per_second": 12.301,
+      "eval_steps_per_second": 0.559,
       "step": 34
     },
     {
+      "epoch": 34.57,
+      "eval_accuracy": 0.8636363636363636,
+      "eval_loss": 0.2848185896873474,
+      "eval_runtime": 1.8362,
+      "eval_samples_per_second": 11.981,
+      "eval_steps_per_second": 0.545,
       "step": 35
     },
     {
+      "epoch": 35.57,
+      "eval_accuracy": 0.8636363636363636,
+      "eval_loss": 0.2748388946056366,
+      "eval_runtime": 1.8319,
+      "eval_samples_per_second": 12.009,
+      "eval_steps_per_second": 0.546,
       "step": 36
     },
     {
+      "epoch": 36.57,
+      "eval_accuracy": 0.8636363636363636,
+      "eval_loss": 0.2679346203804016,
+      "eval_runtime": 1.6038,
+      "eval_samples_per_second": 13.718,
+      "eval_steps_per_second": 0.624,
       "step": 37
     },
     {
+      "epoch": 37.57,
+      "eval_accuracy": 0.8636363636363636,
+      "eval_loss": 0.26424679160118103,
+      "eval_runtime": 1.8361,
+      "eval_samples_per_second": 11.982,
+      "eval_steps_per_second": 0.545,
       "step": 38
     },
     {
+      "epoch": 38.57,
+      "eval_accuracy": 0.8636363636363636,
+      "eval_loss": 0.2638870179653168,
+      "eval_runtime": 1.7769,
+      "eval_samples_per_second": 12.381,
+      "eval_steps_per_second": 0.563,
       "step": 39
     },
     {
+      "epoch": 39.57,
       "learning_rate": 0.0,
+      "loss": 0.728,
       "step": 40
     },
     {
+      "epoch": 39.57,
+      "eval_accuracy": 0.8636363636363636,
+      "eval_loss": 0.26363667845726013,
+      "eval_runtime": 1.7373,
+      "eval_samples_per_second": 12.663,
+      "eval_steps_per_second": 0.576,
       "step": 40
     },
     {
+      "epoch": 39.57,
       "step": 40,
+      "total_flos": 1.9417183005730406e+17,
+      "train_loss": 1.3339122772216796,
+      "train_runtime": 965.4815,
+      "train_samples_per_second": 8.162,
+      "train_steps_per_second": 0.041
     }
   ],
   "max_steps": 40,
   "num_train_epochs": 40,
+  "total_flos": 1.9417183005730406e+17,
   "trial_name": null,
   "trial_params": null
 }