Training in progress, epoch 150, checkpoint

Browse files

Files changed (5) hide show

last-checkpoint/model.safetensors +1 -1
last-checkpoint/optimizer.pt +1 -1
last-checkpoint/rng_state.pth +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +268 -4

last-checkpoint/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:02258098985a292d68d20bf94bf89b17ca13110b1ae56ee863f5f0d079f4238d
 size 166496880

 version https://git-lfs.github.com/spec/v1
+oid sha256:c68708ddbc2ce9bc9e9ccad6d7415318162ee67548e6384ae6b28daeaab67d4a
 size 166496880

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:761e90a5b9c3c01cf812cc7dbf7f8345138f49ad9e203ed4d4779cfad169a777
 size 330495866

 version https://git-lfs.github.com/spec/v1
+oid sha256:cb53150c0e656b9af7412cfa4aa611989973d87a578aaf3904c2959edee764c6
 size 330495866

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:74ff39ce5bc1f6039b31922a6e443ab8d8a8f93d5528fc0d576340ae329fb493
 size 14244

 version https://git-lfs.github.com/spec/v1
+oid sha256:ceefbb484abd4ed8dc8842b1277aaf2814ba0b1602ab48247135b7cfe2173c79
 size 14244

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:eb678f76da1c9347406d38fe82346b2ac3acd84e6118cb46f17ee79a3da28612
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:531fa53bf2bb93608e8c8228dd565bd5fe95292cd882c1935da101ac5d413c48
 size 1064

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,9 +1,9 @@
 {
   "best_metric": 0.24468238651752472,
   "best_model_checkpoint": "chickens-composite-403232323232-150-epochs-wo-transform-metrics-test/checkpoint-95000",
-  "epoch": 149.0,
   "eval_steps": 500,
-  "global_step": 149000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -38643,6 +38643,270 @@
       "eval_samples_per_second": 14.74,
       "eval_steps_per_second": 1.843,
       "step": 149000
     }
   ],
   "logging_steps": 30,
@@ -38657,12 +38921,12 @@
         "should_evaluate": false,
         "should_log": false,
         "should_save": true,
-        "should_training_stop": false
       },
       "attributes": {}
     }
   },
-  "total_flos": 5.12594438234112e+19,
   "train_batch_size": 2,
   "trial_name": null,
   "trial_params": null

 {
   "best_metric": 0.24468238651752472,
   "best_model_checkpoint": "chickens-composite-403232323232-150-epochs-wo-transform-metrics-test/checkpoint-95000",
+  "epoch": 150.0,
   "eval_steps": 500,
+  "global_step": 150000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 14.74,
       "eval_steps_per_second": 1.843,
       "step": 149000
+    },
+    {
+      "epoch": 149.01,
+      "grad_norm": 43.52349090576172,
+      "learning_rate": 1.074761413334957e-09,
+      "loss": 0.1746,
+      "step": 149010
+    },
+    {
+      "epoch": 149.04,
+      "grad_norm": 46.12135696411133,
+      "learning_rate": 1.0106134441850712e-09,
+      "loss": 0.178,
+      "step": 149040
+    },
+    {
+      "epoch": 149.07,
+      "grad_norm": 46.01811981201172,
+      "learning_rate": 9.484389968766882e-10,
+      "loss": 0.1987,
+      "step": 149070
+    },
+    {
+      "epoch": 149.1,
+      "grad_norm": 93.64151763916016,
+      "learning_rate": 8.88238095955174e-10,
+      "loss": 0.1794,
+      "step": 149100
+    },
+    {
+      "epoch": 149.13,
+      "grad_norm": 70.12222290039062,
+      "learning_rate": 8.300107651859623e-10,
+      "loss": 0.1959,
+      "step": 149130
+    },
+    {
+      "epoch": 149.16,
+      "grad_norm": 52.35565948486328,
+      "learning_rate": 7.737570275573314e-10,
+      "loss": 0.1725,
+      "step": 149160
+    },
+    {
+      "epoch": 149.19,
+      "grad_norm": 94.19457244873047,
+      "learning_rate": 7.194769052765171e-10,
+      "loss": 0.1915,
+      "step": 149190
+    },
+    {
+      "epoch": 149.22,
+      "grad_norm": 60.45103454589844,
+      "learning_rate": 6.671704197735995e-10,
+      "loss": 0.1758,
+      "step": 149220
+    },
+    {
+      "epoch": 149.25,
+      "grad_norm": 82.6115951538086,
+      "learning_rate": 6.168375916970615e-10,
+      "loss": 0.185,
+      "step": 149250
+    },
+    {
+      "epoch": 149.28,
+      "grad_norm": 54.11577224731445,
+      "learning_rate": 5.684784409182298e-10,
+      "loss": 0.1871,
+      "step": 149280
+    },
+    {
+      "epoch": 149.31,
+      "grad_norm": 39.203857421875,
+      "learning_rate": 5.220929865284996e-10,
+      "loss": 0.178,
+      "step": 149310
+    },
+    {
+      "epoch": 149.34,
+      "grad_norm": 53.700557708740234,
+      "learning_rate": 4.776812468398895e-10,
+      "loss": 0.1823,
+      "step": 149340
+    },
+    {
+      "epoch": 149.37,
+      "grad_norm": 119.4373550415039,
+      "learning_rate": 4.3524323938559655e-10,
+      "loss": 0.1805,
+      "step": 149370
+    },
+    {
+      "epoch": 149.4,
+      "grad_norm": 34.55750274658203,
+      "learning_rate": 3.9477898091944135e-10,
+      "loss": 0.1574,
+      "step": 149400
+    },
+    {
+      "epoch": 149.43,
+      "grad_norm": 66.53358459472656,
+      "learning_rate": 3.562884874158679e-10,
+      "loss": 0.1903,
+      "step": 149430
+    },
+    {
+      "epoch": 149.46,
+      "grad_norm": 45.662715911865234,
+      "learning_rate": 3.1977177407105376e-10,
+      "loss": 0.1777,
+      "step": 149460
+    },
+    {
+      "epoch": 149.49,
+      "grad_norm": 487.13580322265625,
+      "learning_rate": 2.8522885530013475e-10,
+      "loss": 0.1914,
+      "step": 149490
+    },
+    {
+      "epoch": 149.52,
+      "grad_norm": 39.44456481933594,
+      "learning_rate": 2.5265974474109054e-10,
+      "loss": 0.1685,
+      "step": 149520
+    },
+    {
+      "epoch": 149.55,
+      "grad_norm": 154.51235961914062,
+      "learning_rate": 2.2206445525085886e-10,
+      "loss": 0.173,
+      "step": 149550
+    },
+    {
+      "epoch": 149.58,
+      "grad_norm": 43.05788040161133,
+      "learning_rate": 1.9344299890866614e-10,
+      "loss": 0.1993,
+      "step": 149580
+    },
+    {
+      "epoch": 149.61,
+      "grad_norm": 55.20720291137695,
+      "learning_rate": 1.6679538701325215e-10,
+      "loss": 0.19,
+      "step": 149610
+    },
+    {
+      "epoch": 149.64,
+      "grad_norm": 58.366329193115234,
+      "learning_rate": 1.4212163008509028e-10,
+      "loss": 0.1794,
+      "step": 149640
+    },
+    {
+      "epoch": 149.67,
+      "grad_norm": 79.63877868652344,
+      "learning_rate": 1.1942173786527732e-10,
+      "loss": 0.1677,
+      "step": 149670
+    },
+    {
+      "epoch": 149.7,
+      "grad_norm": 37.779273986816406,
+      "learning_rate": 9.869571931442334e-11,
+      "loss": 0.1708,
+      "step": 149700
+    },
+    {
+      "epoch": 149.73,
+      "grad_norm": 55.10169219970703,
+      "learning_rate": 7.994358261542712e-11,
+      "loss": 0.1637,
+      "step": 149730
+    },
+    {
+      "epoch": 149.76,
+      "grad_norm": 43.75123596191406,
+      "learning_rate": 6.316533517125578e-11,
+      "loss": 0.173,
+      "step": 149760
+    },
+    {
+      "epoch": 149.79,
+      "grad_norm": 54.85829162597656,
+      "learning_rate": 4.83609836054999e-11,
+      "loss": 0.1813,
+      "step": 149790
+    },
+    {
+      "epoch": 149.82,
+      "grad_norm": 114.27557373046875,
+      "learning_rate": 3.55305337634837e-11,
+      "loss": 0.1563,
+      "step": 149820
+    },
+    {
+      "epoch": 149.85,
+      "grad_norm": 42.012298583984375,
+      "learning_rate": 2.467399070893439e-11,
+      "loss": 0.1784,
+      "step": 149850
+    },
+    {
+      "epoch": 149.88,
+      "grad_norm": 34.330322265625,
+      "learning_rate": 1.57913587295333e-11,
+      "loss": 0.1947,
+      "step": 149880
+    },
+    {
+      "epoch": 149.91,
+      "grad_norm": 118.9654769897461,
+      "learning_rate": 8.882641330809627e-12,
+      "loss": 0.2011,
+      "step": 149910
+    },
+    {
+      "epoch": 149.94,
+      "grad_norm": 51.00263595581055,
+      "learning_rate": 3.947841241136452e-12,
+      "loss": 0.1609,
+      "step": 149940
+    },
+    {
+      "epoch": 149.97,
+      "grad_norm": 93.073486328125,
+      "learning_rate": 9.869604078449612e-13,
+      "loss": 0.1643,
+      "step": 149970
+    },
+    {
+      "epoch": 150.0,
+      "grad_norm": 69.35248565673828,
+      "learning_rate": 0.0,
+      "loss": 0.1556,
+      "step": 150000
+    },
+    {
+      "epoch": 150.0,
+      "eval_loss": 0.25540733337402344,
+      "eval_map": 0.8454,
+      "eval_map_50": 0.9638,
+      "eval_map_75": 0.9414,
+      "eval_map_chicken": 0.8417,
+      "eval_map_duck": 0.7981,
+      "eval_map_large": 0.8191,
+      "eval_map_medium": 0.8525,
+      "eval_map_plant": 0.8964,
+      "eval_map_small": 0.3586,
+      "eval_mar_1": 0.3399,
+      "eval_mar_10": 0.8795,
+      "eval_mar_100": 0.8819,
+      "eval_mar_100_chicken": 0.8813,
+      "eval_mar_100_duck": 0.8407,
+      "eval_mar_100_plant": 0.9237,
+      "eval_mar_large": 0.8593,
+      "eval_mar_medium": 0.8889,
+      "eval_mar_small": 0.5029,
+      "eval_runtime": 13.4354,
+      "eval_samples_per_second": 14.886,
+      "eval_steps_per_second": 1.861,
+      "step": 150000
     }
   ],
   "logging_steps": 30,
         "should_evaluate": false,
         "should_log": false,
         "should_save": true,
+        "should_training_stop": true
       },
       "attributes": {}
     }
   },
+  "total_flos": 5.160346693632e+19,
   "train_batch_size": 2,
   "trial_name": null,
   "trial_params": null