End of training

Browse files

Files changed (11) hide show

all_results.json +12 -12
eval_results.json +8 -8
pytorch_model.bin +1 -1
runs/Aug24_19-05-23_bernini/1724519134.3266222/events.out.tfevents.1724519134.bernini.17504.1 +3 -0
runs/Aug24_19-05-23_bernini/events.out.tfevents.1724519134.bernini.17504.0 +3 -0
runs/Aug24_19-05-59_bernini/1724519169.7377124/events.out.tfevents.1724519169.bernini.18373.1 +3 -0
runs/Aug24_19-05-59_bernini/events.out.tfevents.1724519169.bernini.18373.0 +3 -0
runs/Aug24_19-05-59_bernini/events.out.tfevents.1724519497.bernini.18373.2 +3 -0
train_results.json +5 -5
trainer_state.json +107 -155
training_args.bin +1 -1

all_results.json CHANGED Viewed

@@ -1,14 +1,14 @@
 {
-    "epoch": 26.67,
-    "eval_accuracy": 0.8414101975195223,
-    "eval_f1": 0.8868156150257795,
-    "eval_loss": 0.6016380190849304,
-    "eval_precision": 0.8712011577424024,
     "eval_recall": 0.903,
-    "eval_runtime": 3.7201,
     "eval_samples": 54,
-    "eval_samples_per_second": 14.516,
-    "eval_steps_per_second": 1.613,
     "predict_accuracy": 0.8218373936014088,
     "predict_f1": 0.9038133181559477,
     "predict_loss": 0.6888472437858582,
@@ -17,9 +17,9 @@
     "predict_runtime": 2.0596,
     "predict_samples_per_second": 8.74,
     "predict_steps_per_second": 0.971,
-    "train_loss": 0.3642783355712891,
-    "train_runtime": 422.552,
     "train_samples": 150,
-    "train_samples_per_second": 9.466,
-    "train_steps_per_second": 0.947
 }

 {
+    "epoch": 20.0,
+    "eval_accuracy": 0.8434772622875517,
+    "eval_f1": 0.8826979472140762,
+    "eval_loss": 0.5468625426292419,
+    "eval_precision": 0.8632887189292543,
     "eval_recall": 0.903,
+    "eval_runtime": 3.697,
     "eval_samples": 54,
+    "eval_samples_per_second": 14.607,
+    "eval_steps_per_second": 1.623,
     "predict_accuracy": 0.8218373936014088,
     "predict_f1": 0.9038133181559477,
     "predict_loss": 0.6888472437858582,
     "predict_runtime": 2.0596,
     "predict_samples_per_second": 8.74,
     "predict_steps_per_second": 0.971,
+    "train_loss": 0.4636675516764323,
+    "train_runtime": 318.7136,
     "train_samples": 150,
+    "train_samples_per_second": 9.413,
+    "train_steps_per_second": 0.941
 }

eval_results.json CHANGED Viewed

@@ -1,12 +1,12 @@
 {
-    "epoch": 26.67,
-    "eval_accuracy": 0.8414101975195223,
-    "eval_f1": 0.8868156150257795,
-    "eval_loss": 0.6016380190849304,
-    "eval_precision": 0.8712011577424024,
     "eval_recall": 0.903,
-    "eval_runtime": 3.7201,
     "eval_samples": 54,
-    "eval_samples_per_second": 14.516,
-    "eval_steps_per_second": 1.613
 }

 {
+    "epoch": 20.0,
+    "eval_accuracy": 0.8434772622875517,
+    "eval_f1": 0.8826979472140762,
+    "eval_loss": 0.5468625426292419,
+    "eval_precision": 0.8632887189292543,
     "eval_recall": 0.903,
+    "eval_runtime": 3.697,
     "eval_samples": 54,
+    "eval_samples_per_second": 14.607,
+    "eval_steps_per_second": 1.623
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:8356f85a16aec70deef67c107e63fd773b89ce3c9d102cc38b7811b85a8d9f28
 size 501420883

 version https://git-lfs.github.com/spec/v1
+oid sha256:6676119aed64fb98a2529aadd0eb6d8a586dc32bcd9cdd67336343409ea44e02
 size 501420883

runs/Aug24_19-05-23_bernini/1724519134.3266222/events.out.tfevents.1724519134.bernini.17504.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:3567ad87f4f04882cac3ee81fab510fe0ea8bd30b664c041c60a6771b1fee1ed
+size 4665

runs/Aug24_19-05-23_bernini/events.out.tfevents.1724519134.bernini.17504.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4f5911ff645def4a8801e6d52fe4b852492f56fb2b139d66696c69465668ed94
+size 4084

runs/Aug24_19-05-59_bernini/1724519169.7377124/events.out.tfevents.1724519169.bernini.18373.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:23326fd504bb10a270cd4df7abfdf08f9e8526a47c6a70f7858452efead7b18d
+size 4665

runs/Aug24_19-05-59_bernini/events.out.tfevents.1724519169.bernini.18373.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b272c865a684aecff29dccecb35f4af06910a0c7efbeee0206fe484b11f5d846
+size 10057

runs/Aug24_19-05-59_bernini/events.out.tfevents.1724519497.bernini.18373.2 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:8c79aa0dc0ca446e6bee51eae633e866665dabf054bb73041944a0c4bf6c76ff
+size 512

train_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
-    "epoch": 26.67,
-    "train_loss": 0.3642783355712891,
-    "train_runtime": 422.552,
     "train_samples": 150,
-    "train_samples_per_second": 9.466,
-    "train_steps_per_second": 0.947
 }

 {
+    "epoch": 20.0,
+    "train_loss": 0.4636675516764323,
+    "train_runtime": 318.7136,
     "train_samples": 150,
+    "train_samples_per_second": 9.413,
+    "train_steps_per_second": 0.941
 }

trainer_state.json CHANGED Viewed

@@ -1,217 +1,169 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 26.666666666666668,
-  "global_step": 400,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
       "epoch": 1.67,
-      "eval_accuracy": 0.6659393661001378,
-      "eval_f1": 0.5035663338088445,
-      "eval_loss": 1.1944581270217896,
-      "eval_precision": 0.4800543970988214,
-      "eval_recall": 0.5295,
-      "eval_runtime": 3.6912,
-      "eval_samples_per_second": 14.629,
-      "eval_steps_per_second": 1.625,
       "step": 25
     },
     {
       "epoch": 3.33,
       "eval_accuracy": 0.7687184198438217,
-      "eval_f1": 0.7759615384615385,
-      "eval_loss": 0.7770130038261414,
-      "eval_precision": 0.7472222222222222,
-      "eval_recall": 0.807,
-      "eval_runtime": 3.7057,
-      "eval_samples_per_second": 14.572,
-      "eval_steps_per_second": 1.619,
       "step": 50
     },
     {
       "epoch": 5.0,
-      "eval_accuracy": 0.8118971061093248,
-      "eval_f1": 0.8231029482841953,
-      "eval_loss": 0.5989910364151001,
-      "eval_precision": 0.7965388213283442,
-      "eval_recall": 0.8515,
-      "eval_runtime": 3.6962,
-      "eval_samples_per_second": 14.61,
-      "eval_steps_per_second": 1.623,
       "step": 75
     },
     {
       "epoch": 6.67,
-      "eval_accuracy": 0.7702112999540652,
-      "eval_f1": 0.8409471418320977,
-      "eval_loss": 0.6813620924949646,
-      "eval_precision": 0.8060522696011004,
-      "eval_recall": 0.879,
-      "eval_runtime": 3.7519,
-      "eval_samples_per_second": 14.393,
-      "eval_steps_per_second": 1.599,
       "step": 100
     },
     {
       "epoch": 8.33,
-      "eval_accuracy": 0.8316490583371612,
-      "eval_f1": 0.8467469879518073,
-      "eval_loss": 0.5391940474510193,
-      "eval_precision": 0.8172093023255814,
-      "eval_recall": 0.8785,
-      "eval_runtime": 3.7222,
-      "eval_samples_per_second": 14.508,
-      "eval_steps_per_second": 1.612,
       "step": 125
     },
     {
       "epoch": 10.0,
-      "eval_accuracy": 0.811437758383096,
-      "eval_f1": 0.8603297769156159,
-      "eval_loss": 0.5438030362129211,
-      "eval_precision": 0.835216572504708,
-      "eval_recall": 0.887,
-      "eval_runtime": 3.7662,
-      "eval_samples_per_second": 14.338,
-      "eval_steps_per_second": 1.593,
       "step": 150
     },
     {
       "epoch": 11.67,
-      "eval_accuracy": 0.838194763435921,
-      "eval_f1": 0.8752145133611179,
-      "eval_loss": 0.5429797172546387,
-      "eval_precision": 0.8585858585858586,
-      "eval_recall": 0.8925,
-      "eval_runtime": 3.7544,
-      "eval_samples_per_second": 14.383,
-      "eval_steps_per_second": 1.598,
       "step": 175
     },
     {
       "epoch": 13.33,
-      "eval_accuracy": 0.8257923748277446,
-      "eval_f1": 0.8691817736403724,
-      "eval_loss": 0.5896742939949036,
-      "eval_precision": 0.8520653218059558,
-      "eval_recall": 0.887,
-      "eval_runtime": 3.775,
-      "eval_samples_per_second": 14.305,
-      "eval_steps_per_second": 1.589,
       "step": 200
     },
     {
       "epoch": 15.0,
-      "eval_accuracy": 0.8430179145613229,
-      "eval_f1": 0.8809756097560977,
-      "eval_loss": 0.5427059531211853,
-      "eval_precision": 0.86,
-      "eval_recall": 0.903,
-      "eval_runtime": 3.6868,
-      "eval_samples_per_second": 14.647,
-      "eval_steps_per_second": 1.627,
       "step": 225
     },
     {
       "epoch": 16.67,
-      "eval_accuracy": 0.8410656867248507,
-      "eval_f1": 0.8822512959763021,
-      "eval_loss": 0.5541779398918152,
-      "eval_precision": 0.871282301316431,
-      "eval_recall": 0.8935,
-      "eval_runtime": 3.7479,
-      "eval_samples_per_second": 14.408,
-      "eval_steps_per_second": 1.601,
       "step": 250
     },
     {
       "epoch": 18.33,
-      "eval_accuracy": 0.83210840606339,
-      "eval_f1": 0.8821515892420537,
-      "eval_loss": 0.6013592481613159,
-      "eval_precision": 0.8631578947368421,
-      "eval_recall": 0.902,
-      "eval_runtime": 3.7532,
-      "eval_samples_per_second": 14.388,
-      "eval_steps_per_second": 1.599,
       "step": 275
     },
     {
       "epoch": 20.0,
-      "eval_accuracy": 0.8365870463941204,
-      "eval_f1": 0.8843036109064112,
-      "eval_loss": 0.5971384644508362,
-      "eval_precision": 0.8691453404152584,
-      "eval_recall": 0.9,
-      "eval_runtime": 3.7851,
-      "eval_samples_per_second": 14.267,
-      "eval_steps_per_second": 1.585,
-      "step": 300
-    },
-    {
-      "epoch": 21.67,
-      "eval_accuracy": 0.8313045475424896,
-      "eval_f1": 0.8891637803067788,
-      "eval_loss": 0.598324716091156,
-      "eval_precision": 0.8800195886385896,
-      "eval_recall": 0.8985,
-      "eval_runtime": 3.7401,
-      "eval_samples_per_second": 14.438,
-      "eval_steps_per_second": 1.604,
-      "step": 325
-    },
-    {
-      "epoch": 23.33,
-      "eval_accuracy": 0.8414101975195223,
-      "eval_f1": 0.8964497041420119,
-      "eval_loss": 0.5867139101028442,
-      "eval_precision": 0.8842412451361867,
-      "eval_recall": 0.909,
-      "eval_runtime": 3.7391,
-      "eval_samples_per_second": 14.442,
-      "eval_steps_per_second": 1.605,
-      "step": 350
-    },
-    {
-      "epoch": 25.0,
-      "eval_accuracy": 0.8465778594395957,
-      "eval_f1": 0.8928835262250677,
-      "eval_loss": 0.5947966575622559,
-      "eval_precision": 0.8796700630761766,
-      "eval_recall": 0.9065,
-      "eval_runtime": 3.6661,
-      "eval_samples_per_second": 14.73,
-      "eval_steps_per_second": 1.637,
-      "step": 375
-    },
-    {
-      "epoch": 26.67,
-      "eval_accuracy": 0.8414101975195223,
-      "eval_f1": 0.8868156150257795,
-      "eval_loss": 0.6016380190849304,
-      "eval_precision": 0.8712011577424024,
       "eval_recall": 0.903,
-      "eval_runtime": 3.6984,
-      "eval_samples_per_second": 14.601,
-      "eval_steps_per_second": 1.622,
-      "step": 400
     },
     {
-      "epoch": 26.67,
-      "step": 400,
-      "total_flos": 1054421372928000.0,
-      "train_loss": 0.3642783355712891,
-      "train_runtime": 422.552,
-      "train_samples_per_second": 9.466,
-      "train_steps_per_second": 0.947
     }
   ],
-  "max_steps": 400,
-  "num_train_epochs": 27,
-  "total_flos": 1054421372928000.0,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 20.0,
+  "global_step": 300,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
       "epoch": 1.67,
+      "eval_accuracy": 0.6553743683968765,
+      "eval_f1": 0.49752416882810657,
+      "eval_loss": 1.2105501890182495,
+      "eval_precision": 0.4707719767960732,
+      "eval_recall": 0.5275,
+      "eval_runtime": 3.73,
+      "eval_samples_per_second": 14.477,
+      "eval_steps_per_second": 1.609,
       "step": 25
     },
     {
       "epoch": 3.33,
       "eval_accuracy": 0.7687184198438217,
+      "eval_f1": 0.777563793933558,
+      "eval_loss": 0.7854474186897278,
+      "eval_precision": 0.7497678737233054,
+      "eval_recall": 0.8075,
+      "eval_runtime": 3.7553,
+      "eval_samples_per_second": 14.38,
+      "eval_steps_per_second": 1.598,
       "step": 50
     },
     {
       "epoch": 5.0,
+      "eval_accuracy": 0.8141938447404685,
+      "eval_f1": 0.8184898354307841,
+      "eval_loss": 0.6001709699630737,
+      "eval_precision": 0.7931519699812383,
+      "eval_recall": 0.8455,
+      "eval_runtime": 3.7036,
+      "eval_samples_per_second": 14.58,
+      "eval_steps_per_second": 1.62,
       "step": 75
     },
     {
       "epoch": 6.67,
+      "eval_accuracy": 0.7781350482315113,
+      "eval_f1": 0.827977315689981,
+      "eval_loss": 0.6523196697235107,
+      "eval_precision": 0.7849462365591398,
+      "eval_recall": 0.876,
+      "eval_runtime": 3.7641,
+      "eval_samples_per_second": 14.346,
+      "eval_steps_per_second": 1.594,
       "step": 100
     },
     {
       "epoch": 8.33,
+      "eval_accuracy": 0.8354386770785485,
+      "eval_f1": 0.8442622950819673,
+      "eval_loss": 0.5189960598945618,
+      "eval_precision": 0.8151769087523277,
+      "eval_recall": 0.8755,
+      "eval_runtime": 3.8049,
+      "eval_samples_per_second": 14.192,
+      "eval_steps_per_second": 1.577,
       "step": 125
     },
     {
       "epoch": 10.0,
+      "eval_accuracy": 0.8338309600367478,
+      "eval_f1": 0.8588007736943907,
+      "eval_loss": 0.5064252018928528,
+      "eval_precision": 0.8314606741573034,
+      "eval_recall": 0.888,
+      "eval_runtime": 3.7776,
+      "eval_samples_per_second": 14.295,
+      "eval_steps_per_second": 1.588,
       "step": 150
     },
     {
       "epoch": 11.67,
+      "eval_accuracy": 0.8344051446945338,
+      "eval_f1": 0.8693320331545589,
+      "eval_loss": 0.5342020392417908,
+      "eval_precision": 0.8482397716460514,
+      "eval_recall": 0.8915,
+      "eval_runtime": 3.753,
+      "eval_samples_per_second": 14.388,
+      "eval_steps_per_second": 1.599,
       "step": 175
     },
     {
       "epoch": 13.33,
+      "eval_accuracy": 0.8200505282498851,
+      "eval_f1": 0.8703071672354948,
+      "eval_loss": 0.5538159012794495,
+      "eval_precision": 0.8491912464319695,
+      "eval_recall": 0.8925,
+      "eval_runtime": 3.8395,
+      "eval_samples_per_second": 14.064,
+      "eval_steps_per_second": 1.563,
       "step": 200
     },
     {
       "epoch": 15.0,
+      "eval_accuracy": 0.8348644924207625,
+      "eval_f1": 0.8777398928397467,
+      "eval_loss": 0.5335590243339539,
+      "eval_precision": 0.855650522317189,
+      "eval_recall": 0.901,
+      "eval_runtime": 3.7278,
+      "eval_samples_per_second": 14.486,
+      "eval_steps_per_second": 1.61,
       "step": 225
     },
     {
       "epoch": 16.67,
+      "eval_accuracy": 0.8385392742305926,
+      "eval_f1": 0.8764648437499999,
+      "eval_loss": 0.5464726686477661,
+      "eval_precision": 0.8563931297709924,
+      "eval_recall": 0.8975,
+      "eval_runtime": 3.7679,
+      "eval_samples_per_second": 14.331,
+      "eval_steps_per_second": 1.592,
       "step": 250
     },
     {
       "epoch": 18.33,
+      "eval_accuracy": 0.8439366100137804,
+      "eval_f1": 0.8787509148572822,
+      "eval_loss": 0.5402917265892029,
+      "eval_precision": 0.8580276322058122,
+      "eval_recall": 0.9005,
+      "eval_runtime": 3.7992,
+      "eval_samples_per_second": 14.214,
+      "eval_steps_per_second": 1.579,
       "step": 275
     },
     {
       "epoch": 20.0,
+      "eval_accuracy": 0.8434772622875517,
+      "eval_f1": 0.8826979472140762,
+      "eval_loss": 0.5468625426292419,
+      "eval_precision": 0.8632887189292543,
       "eval_recall": 0.903,
+      "eval_runtime": 3.7775,
+      "eval_samples_per_second": 14.295,
+      "eval_steps_per_second": 1.588,
+      "step": 300
     },
     {
+      "epoch": 20.0,
+      "step": 300,
+      "total_flos": 790816029696000.0,
+      "train_loss": 0.4636675516764323,
+      "train_runtime": 318.7136,
+      "train_samples_per_second": 9.413,
+      "train_steps_per_second": 0.941
     }
   ],
+  "max_steps": 300,
+  "num_train_epochs": 20,
+  "total_flos": 790816029696000.0,
   "trial_name": null,
   "trial_params": null
 }

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:18524bbd71a9c1f456e0c326136d3674e674011210065da46f04684edfe11cdc
 size 2927

 version https://git-lfs.github.com/spec/v1
+oid sha256:ad5c6ae451d7fcc096ada600794b9529838382a07bad9f882b8f80b359b5b02b
 size 2927