Training in progress, step 250000

Browse files

Files changed (14) hide show

last-checkpoint/optimizer.pt +1 -1
last-checkpoint/pytorch_model.bin +1 -1
last-checkpoint/rng_state_0.pth +1 -1
last-checkpoint/rng_state_1.pth +1 -1
last-checkpoint/rng_state_2.pth +1 -1
last-checkpoint/rng_state_3.pth +1 -1
last-checkpoint/rng_state_4.pth +1 -1
last-checkpoint/rng_state_5.pth +1 -1
last-checkpoint/rng_state_6.pth +1 -1
last-checkpoint/rng_state_7.pth +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +311 -3
pytorch_model.bin +1 -1
runs/Dec30_18-40-28_t1v-n-04a8ed02-w-0/events.out.tfevents.1672425831.t1v-n-04a8ed02-w-0.140641.0 +2 -2

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:3764d72a3a79bfe4481087bbd68d97d2612ad48d110bd48c10032b892a83feba
 size 3480942553

 version https://git-lfs.github.com/spec/v1
+oid sha256:a578f7551dd077a1741a9d5dcd3bd4333580b2731835a3f015fe22360df3a83b
 size 3480942553

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b50fc4c143fa021b539acb83a937f3d51c4fdca49208b9a63fa78877dd7ef5f4
 size 1740493675

 version https://git-lfs.github.com/spec/v1
+oid sha256:8ae9f86b8b89b814acf498e9a03aed893c7c849c7e09de5ee986508668cb6375
 size 1740493675

last-checkpoint/rng_state_0.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a074b507a370916bd636e490a16b1bdbb7fae87af4799ba27a9eb05b638894c1
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:c1d56a3662a3ebad3c3a7ebbc555dfbf27635a16b7620edcb1f2e45f19fa72d6
 size 13611

last-checkpoint/rng_state_1.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a074b507a370916bd636e490a16b1bdbb7fae87af4799ba27a9eb05b638894c1
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:c1d56a3662a3ebad3c3a7ebbc555dfbf27635a16b7620edcb1f2e45f19fa72d6
 size 13611

last-checkpoint/rng_state_2.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a074b507a370916bd636e490a16b1bdbb7fae87af4799ba27a9eb05b638894c1
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:c1d56a3662a3ebad3c3a7ebbc555dfbf27635a16b7620edcb1f2e45f19fa72d6
 size 13611

last-checkpoint/rng_state_3.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a074b507a370916bd636e490a16b1bdbb7fae87af4799ba27a9eb05b638894c1
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:c1d56a3662a3ebad3c3a7ebbc555dfbf27635a16b7620edcb1f2e45f19fa72d6
 size 13611

last-checkpoint/rng_state_4.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a074b507a370916bd636e490a16b1bdbb7fae87af4799ba27a9eb05b638894c1
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:c1d56a3662a3ebad3c3a7ebbc555dfbf27635a16b7620edcb1f2e45f19fa72d6
 size 13611

last-checkpoint/rng_state_5.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a074b507a370916bd636e490a16b1bdbb7fae87af4799ba27a9eb05b638894c1
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:c1d56a3662a3ebad3c3a7ebbc555dfbf27635a16b7620edcb1f2e45f19fa72d6
 size 13611

last-checkpoint/rng_state_6.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a074b507a370916bd636e490a16b1bdbb7fae87af4799ba27a9eb05b638894c1
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:c1d56a3662a3ebad3c3a7ebbc555dfbf27635a16b7620edcb1f2e45f19fa72d6
 size 13611

last-checkpoint/rng_state_7.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a074b507a370916bd636e490a16b1bdbb7fae87af4799ba27a9eb05b638894c1
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:c1d56a3662a3ebad3c3a7ebbc555dfbf27635a16b7620edcb1f2e45f19fa72d6
 size 13611

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:be1ccf49f4804619cd7d22b74b595a694a368e629a10492b4089d6536d07bdf2
 size 623

 version https://git-lfs.github.com/spec/v1
+oid sha256:7924e9d3f9ed054868d3ddaa60025f26707d231e7eacc5684e8550acfee9e9c0
 size 623

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 0.2,
-  "global_step": 200000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -1238,11 +1238,319 @@
       "eval_samples_per_second": 53.12,
       "eval_steps_per_second": 0.839,
       "step": 200000
     }
   ],
   "max_steps": 1000000,
   "num_train_epochs": 9223372036854775807,
-  "total_flos": 1.19337545367552e+19,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 0.25,
+  "global_step": 250000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 53.12,
       "eval_steps_per_second": 0.839,
       "step": 200000
+    },
+    {
+      "epoch": 0.2,
+      "learning_rate": 9.389475079423988e-05,
+      "loss": 0.9702,
+      "step": 201000
+    },
+    {
+      "epoch": 0.2,
+      "learning_rate": 9.381533400219318e-05,
+      "loss": 0.9585,
+      "step": 202000
+    },
+    {
+      "epoch": 0.2,
+      "learning_rate": 9.373543805267368e-05,
+      "loss": 0.9457,
+      "step": 203000
+    },
+    {
+      "epoch": 0.2,
+      "learning_rate": 9.365506381941066e-05,
+      "loss": 0.9351,
+      "step": 204000
+    },
+    {
+      "epoch": 0.2,
+      "learning_rate": 9.357421218136386e-05,
+      "loss": 0.9504,
+      "step": 205000
+    },
+    {
+      "epoch": 0.21,
+      "learning_rate": 9.349288402271388e-05,
+      "loss": 0.9256,
+      "step": 206000
+    },
+    {
+      "epoch": 0.21,
+      "learning_rate": 9.341108023285238e-05,
+      "loss": 0.9405,
+      "step": 207000
+    },
+    {
+      "epoch": 0.21,
+      "learning_rate": 9.332880170637252e-05,
+      "loss": 0.9389,
+      "step": 208000
+    },
+    {
+      "epoch": 0.21,
+      "learning_rate": 9.32460493430591e-05,
+      "loss": 0.9298,
+      "step": 209000
+    },
+    {
+      "epoch": 0.21,
+      "learning_rate": 9.316282404787871e-05,
+      "loss": 0.9273,
+      "step": 210000
+    },
+    {
+      "epoch": 0.21,
+      "learning_rate": 9.30791267309698e-05,
+      "loss": 0.9418,
+      "step": 211000
+    },
+    {
+      "epoch": 0.21,
+      "learning_rate": 9.299495830763286e-05,
+      "loss": 0.9566,
+      "step": 212000
+    },
+    {
+      "epoch": 0.21,
+      "learning_rate": 9.291031969832026e-05,
+      "loss": 0.9473,
+      "step": 213000
+    },
+    {
+      "epoch": 0.21,
+      "learning_rate": 9.282521182862629e-05,
+      "loss": 0.9439,
+      "step": 214000
+    },
+    {
+      "epoch": 0.21,
+      "learning_rate": 9.273963562927695e-05,
+      "loss": 0.9234,
+      "step": 215000
+    },
+    {
+      "epoch": 0.22,
+      "learning_rate": 9.265359203611987e-05,
+      "loss": 0.9408,
+      "step": 216000
+    },
+    {
+      "epoch": 0.22,
+      "learning_rate": 9.256708199011401e-05,
+      "loss": 0.9456,
+      "step": 217000
+    },
+    {
+      "epoch": 0.22,
+      "learning_rate": 9.248010643731935e-05,
+      "loss": 0.9313,
+      "step": 218000
+    },
+    {
+      "epoch": 0.22,
+      "learning_rate": 9.239266632888659e-05,
+      "loss": 0.9471,
+      "step": 219000
+    },
+    {
+      "epoch": 0.22,
+      "learning_rate": 9.230476262104677e-05,
+      "loss": 0.9556,
+      "step": 220000
+    },
+    {
+      "epoch": 0.22,
+      "learning_rate": 9.221639627510076e-05,
+      "loss": 0.9346,
+      "step": 221000
+    },
+    {
+      "epoch": 0.22,
+      "learning_rate": 9.212756825740873e-05,
+      "loss": 0.935,
+      "step": 222000
+    },
+    {
+      "epoch": 0.22,
+      "learning_rate": 9.20382795393797e-05,
+      "loss": 0.9133,
+      "step": 223000
+    },
+    {
+      "epoch": 0.22,
+      "learning_rate": 9.194853109746074e-05,
+      "loss": 0.9247,
+      "step": 224000
+    },
+    {
+      "epoch": 0.23,
+      "learning_rate": 9.185832391312644e-05,
+      "loss": 0.9093,
+      "step": 225000
+    },
+    {
+      "epoch": 0.23,
+      "learning_rate": 9.176765897286813e-05,
+      "loss": 0.8778,
+      "step": 226000
+    },
+    {
+      "epoch": 0.23,
+      "learning_rate": 9.167653726818305e-05,
+      "loss": 0.8794,
+      "step": 227000
+    },
+    {
+      "epoch": 0.23,
+      "learning_rate": 9.158495979556358e-05,
+      "loss": 0.9238,
+      "step": 228000
+    },
+    {
+      "epoch": 0.23,
+      "learning_rate": 9.14929275564863e-05,
+      "loss": 0.9351,
+      "step": 229000
+    },
+    {
+      "epoch": 0.23,
+      "learning_rate": 9.140044155740101e-05,
+      "loss": 0.9133,
+      "step": 230000
+    },
+    {
+      "epoch": 0.23,
+      "learning_rate": 9.130750280971978e-05,
+      "loss": 0.9197,
+      "step": 231000
+    },
+    {
+      "epoch": 0.23,
+      "learning_rate": 9.121411232980588e-05,
+      "loss": 0.9007,
+      "step": 232000
+    },
+    {
+      "epoch": 0.23,
+      "learning_rate": 9.112027113896262e-05,
+      "loss": 0.9314,
+      "step": 233000
+    },
+    {
+      "epoch": 0.23,
+      "learning_rate": 9.102598026342222e-05,
+      "loss": 0.9063,
+      "step": 234000
+    },
+    {
+      "epoch": 0.23,
+      "learning_rate": 9.093124073433463e-05,
+      "loss": 0.9354,
+      "step": 235000
+    },
+    {
+      "epoch": 0.24,
+      "learning_rate": 9.083605358775612e-05,
+      "loss": 0.9117,
+      "step": 236000
+    },
+    {
+      "epoch": 0.24,
+      "learning_rate": 9.074041986463808e-05,
+      "loss": 0.9286,
+      "step": 237000
+    },
+    {
+      "epoch": 0.24,
+      "learning_rate": 9.064434061081562e-05,
+      "loss": 0.9249,
+      "step": 238000
+    },
+    {
+      "epoch": 0.24,
+      "learning_rate": 9.0547816876996e-05,
+      "loss": 0.9108,
+      "step": 239000
+    },
+    {
+      "epoch": 0.24,
+      "learning_rate": 9.045084971874738e-05,
+      "loss": 0.9427,
+      "step": 240000
+    },
+    {
+      "epoch": 0.24,
+      "learning_rate": 9.035344019648702e-05,
+      "loss": 0.9355,
+      "step": 241000
+    },
+    {
+      "epoch": 0.24,
+      "learning_rate": 9.025558937546988e-05,
+      "loss": 0.9375,
+      "step": 242000
+    },
+    {
+      "epoch": 0.24,
+      "learning_rate": 9.015729832577681e-05,
+      "loss": 0.9352,
+      "step": 243000
+    },
+    {
+      "epoch": 0.24,
+      "learning_rate": 9.005856812230304e-05,
+      "loss": 0.9345,
+      "step": 244000
+    },
+    {
+      "epoch": 0.24,
+      "learning_rate": 8.995939984474624e-05,
+      "loss": 0.9316,
+      "step": 245000
+    },
+    {
+      "epoch": 0.25,
+      "learning_rate": 8.98597945775948e-05,
+      "loss": 0.926,
+      "step": 246000
+    },
+    {
+      "epoch": 0.25,
+      "learning_rate": 8.975975341011596e-05,
+      "loss": 0.9067,
+      "step": 247000
+    },
+    {
+      "epoch": 0.25,
+      "learning_rate": 8.965927743634391e-05,
+      "loss": 0.8969,
+      "step": 248000
+    },
+    {
+      "epoch": 0.25,
+      "learning_rate": 8.955836775506776e-05,
+      "loss": 0.905,
+      "step": 249000
+    },
+    {
+      "epoch": 0.25,
+      "learning_rate": 8.945702546981969e-05,
+      "loss": 0.8909,
+      "step": 250000
+    },
+    {
+      "epoch": 0.25,
+      "eval_loss": 0.4992561936378479,
+      "eval_runtime": 109.4818,
+      "eval_samples_per_second": 45.67,
+      "eval_steps_per_second": 0.722,
+      "step": 250000
     }
   ],
   "max_steps": 1000000,
   "num_train_epochs": 9223372036854775807,
+  "total_flos": 1.4917193170944e+19,
   "trial_name": null,
   "trial_params": null
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b50fc4c143fa021b539acb83a937f3d51c4fdca49208b9a63fa78877dd7ef5f4
 size 1740493675

 version https://git-lfs.github.com/spec/v1
+oid sha256:8ae9f86b8b89b814acf498e9a03aed893c7c849c7e09de5ee986508668cb6375
 size 1740493675

runs/Dec30_18-40-28_t1v-n-04a8ed02-w-0/events.out.tfevents.1672425831.t1v-n-04a8ed02-w-0.140641.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:5339a495ec01217d2724c7f89b76539049b47a50c595fc32e3aec7f32aec14e7
-size 36822

 version https://git-lfs.github.com/spec/v1
+oid sha256:4c071c23a5db48284dbca67568d37e80b13daab22c8da4de7f5a2d1ccaa0b2b5
+size 45098