Training in progress, epoch 1

Browse files

Files changed (5) hide show

all_results.json +5 -5
pytorch_model.bin +1 -1
train_results.json +5 -5
trainer_state.json +25 -25
training_args.bin +1 -1

all_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
     "epoch": 3.0,
-    "total_flos": 2.32376605913088e+17,
-    "train_loss": 3.054683963457743,
-    "train_runtime": 175.6001,
-    "train_samples_per_second": 17.084,
-    "train_steps_per_second": 0.137
 }

 {
     "epoch": 3.0,
+    "total_flos": 2.77880533604352e+17,
+    "train_loss": 3.9848953088124595,
+    "train_runtime": 321.3932,
+    "train_samples_per_second": 9.334,
+    "train_steps_per_second": 0.075
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:fbb51149e3ab4f2462ff4ccfc4d640ed7e6145853f9787eff19d9f50af37b271
 size 410307017

 version https://git-lfs.github.com/spec/v1
+oid sha256:77fba285dba7d46bf2f67eb1461d08ebd2c08fcc74c440915984b64121049bb9
 size 410307017

train_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
     "epoch": 3.0,
-    "total_flos": 2.32376605913088e+17,
-    "train_loss": 3.054683963457743,
-    "train_runtime": 175.6001,
-    "train_samples_per_second": 17.084,
-    "train_steps_per_second": 0.137
 }

 {
     "epoch": 3.0,
+    "total_flos": 2.77880533604352e+17,
+    "train_loss": 3.9848953088124595,
+    "train_runtime": 321.3932,
+    "train_samples_per_second": 9.334,
+    "train_steps_per_second": 0.075
 }

trainer_state.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
-  "best_metric": 0.7333333333333333,
-  "best_model_checkpoint": "beit-base-patch16-224-pt22k-ft22k/checkpoint-8",
   "epoch": 3.0,
   "eval_steps": 500,
   "global_step": 24,
@@ -10,58 +10,58 @@
   "log_history": [
     {
       "epoch": 1.0,
-      "eval_accuracy": 0.7333333333333333,
-      "eval_loss": 3.1590805053710938,
-      "eval_runtime": 3.4474,
-      "eval_samples_per_second": 69.617,
-      "eval_steps_per_second": 2.321,
       "step": 8
     },
     {
       "epoch": 1.25,
       "learning_rate": 0.03333333333333333,
-      "loss": 5.12,
       "step": 10
     },
     {
       "epoch": 2.0,
-      "eval_accuracy": 0.26666666666666666,
-      "eval_loss": 2.633744716644287,
-      "eval_runtime": 3.2534,
-      "eval_samples_per_second": 73.768,
-      "eval_steps_per_second": 2.459,
       "step": 16
     },
     {
       "epoch": 2.5,
       "learning_rate": 0.009523809523809525,
-      "loss": 1.8305,
       "step": 20
     },
     {
       "epoch": 3.0,
-      "eval_accuracy": 0.7333333333333333,
-      "eval_loss": 0.6371921300888062,
-      "eval_runtime": 3.6339,
-      "eval_samples_per_second": 66.045,
-      "eval_steps_per_second": 2.202,
       "step": 24
     },
     {
       "epoch": 3.0,
       "step": 24,
-      "total_flos": 2.32376605913088e+17,
-      "train_loss": 3.054683963457743,
-      "train_runtime": 175.6001,
-      "train_samples_per_second": 17.084,
-      "train_steps_per_second": 0.137
     }
   ],
   "logging_steps": 10,
   "max_steps": 24,
   "num_train_epochs": 3,
   "save_steps": 500,
-  "total_flos": 2.32376605913088e+17,
   "trial_name": null,
   "trial_params": null
 }

 {
+  "best_metric": 0.725,
+  "best_model_checkpoint": "beit-base-patch16-224-pt22k-ft22k/checkpoint-16",
   "epoch": 3.0,
   "eval_steps": 500,
   "global_step": 24,
   "log_history": [
     {
       "epoch": 1.0,
+      "eval_accuracy": 0.275,
+      "eval_loss": 2.470369815826416,
+      "eval_runtime": 66.8165,
+      "eval_samples_per_second": 3.592,
+      "eval_steps_per_second": 0.12,
       "step": 8
     },
     {
       "epoch": 1.25,
       "learning_rate": 0.03333333333333333,
+      "loss": 8.3532,
       "step": 10
     },
     {
       "epoch": 2.0,
+      "eval_accuracy": 0.725,
+      "eval_loss": 0.685380756855011,
+      "eval_runtime": 3.4245,
+      "eval_samples_per_second": 70.083,
+      "eval_steps_per_second": 2.336,
       "step": 16
     },
     {
       "epoch": 2.5,
       "learning_rate": 0.009523809523809525,
+      "loss": 0.9363,
       "step": 20
     },
     {
       "epoch": 3.0,
+      "eval_accuracy": 0.725,
+      "eval_loss": 0.6314295530319214,
+      "eval_runtime": 3.2582,
+      "eval_samples_per_second": 73.66,
+      "eval_steps_per_second": 2.455,
       "step": 24
     },
     {
       "epoch": 3.0,
       "step": 24,
+      "total_flos": 2.77880533604352e+17,
+      "train_loss": 3.9848953088124595,
+      "train_runtime": 321.3932,
+      "train_samples_per_second": 9.334,
+      "train_steps_per_second": 0.075
     }
   ],
   "logging_steps": 10,
   "max_steps": 24,
   "num_train_epochs": 3,
   "save_steps": 500,
+  "total_flos": 2.77880533604352e+17,
   "trial_name": null,
   "trial_params": null
 }

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:482cb12aab0ceded9970fba68a99a0c3a084beb389d5b2767c37c56bc1db311c
 size 4091

 version https://git-lfs.github.com/spec/v1
+oid sha256:ffbd9d796cc5934996b0bcbde90a6dbdde8985ee8ab80ff909927fdec9534de7
 size 4091