joelniklaus commited on Feb 15, 2023

Commit

0e6e586

1 Parent(s): 056ad06

Training in progress, step 800000

Browse files

Files changed (17) hide show

last-checkpoint/optimizer.pt +1 -1
last-checkpoint/pytorch_model.bin +1 -1
last-checkpoint/rng_state_0.pth +1 -1
last-checkpoint/rng_state_1.pth +1 -1
last-checkpoint/rng_state_2.pth +1 -1
last-checkpoint/rng_state_3.pth +1 -1
last-checkpoint/rng_state_4.pth +1 -1
last-checkpoint/rng_state_5.pth +1 -1
last-checkpoint/rng_state_6.pth +1 -1
last-checkpoint/rng_state_7.pth +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +311 -3
last-checkpoint/training_args.bin +2 -2
pytorch_model.bin +1 -1
runs/Feb09_18-20-41_t1v-n-0cfb531e-w-0/1675967137.0478177/events.out.tfevents.1675967137.t1v-n-0cfb531e-w-0.3767571.1 +3 -0
runs/Feb09_18-20-41_t1v-n-0cfb531e-w-0/events.out.tfevents.1675967137.t1v-n-0cfb531e-w-0.3767571.0 +3 -0
training_args.bin +2 -2

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:83668b91421a0e0a488c25487bfaad007dc55c18cdf463900a44a3ade5b8d40e
 size 1475917081

 version https://git-lfs.github.com/spec/v1
+oid sha256:0736aff937bc5cbe089a02ee96acafe29a3ce8b5ef41405f8f101efedc8d1867
 size 1475917081

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b421ceb551fd425f650a6742be22de59c7f6b297d62820870b0681f67c5a91c4
 size 737971755

 version https://git-lfs.github.com/spec/v1
+oid sha256:a83020031862aea2e988f120ee4fbfdb9e36868ffeeee41e4196243bad5ad70f
 size 737971755

last-checkpoint/rng_state_0.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b0e59fd1cd4b1fd2a1afae2fc772a87dc59b796c76d4e1240f03b46611b2bcc9
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:ea5f4d07228ced52baeea808cd24096aeb8c1e411df6d964bc2778cd1f37bff3
 size 13611

last-checkpoint/rng_state_1.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b0e59fd1cd4b1fd2a1afae2fc772a87dc59b796c76d4e1240f03b46611b2bcc9
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:ea5f4d07228ced52baeea808cd24096aeb8c1e411df6d964bc2778cd1f37bff3
 size 13611

last-checkpoint/rng_state_2.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b0e59fd1cd4b1fd2a1afae2fc772a87dc59b796c76d4e1240f03b46611b2bcc9
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:ea5f4d07228ced52baeea808cd24096aeb8c1e411df6d964bc2778cd1f37bff3
 size 13611

last-checkpoint/rng_state_3.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b0e59fd1cd4b1fd2a1afae2fc772a87dc59b796c76d4e1240f03b46611b2bcc9
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:ea5f4d07228ced52baeea808cd24096aeb8c1e411df6d964bc2778cd1f37bff3
 size 13611

last-checkpoint/rng_state_4.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b0e59fd1cd4b1fd2a1afae2fc772a87dc59b796c76d4e1240f03b46611b2bcc9
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:ea5f4d07228ced52baeea808cd24096aeb8c1e411df6d964bc2778cd1f37bff3
 size 13611

last-checkpoint/rng_state_5.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b0e59fd1cd4b1fd2a1afae2fc772a87dc59b796c76d4e1240f03b46611b2bcc9
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:ea5f4d07228ced52baeea808cd24096aeb8c1e411df6d964bc2778cd1f37bff3
 size 13611

last-checkpoint/rng_state_6.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b0e59fd1cd4b1fd2a1afae2fc772a87dc59b796c76d4e1240f03b46611b2bcc9
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:ea5f4d07228ced52baeea808cd24096aeb8c1e411df6d964bc2778cd1f37bff3
 size 13611

last-checkpoint/rng_state_7.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b0e59fd1cd4b1fd2a1afae2fc772a87dc59b796c76d4e1240f03b46611b2bcc9
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:ea5f4d07228ced52baeea808cd24096aeb8c1e411df6d964bc2778cd1f37bff3
 size 13611

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:411052d7656a2fbf4baa154bd61bcb86c1d4e17113e6919b82f37e9aff99019f
 size 623

 version https://git-lfs.github.com/spec/v1
+oid sha256:50e51b9224ded3ddffee57f26ec45414409de0232579ddafb7f3e083076fa4c5
 size 623

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 0.75,
-  "global_step": 750000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -4626,11 +4626,319 @@
       "eval_samples_per_second": 287.549,
       "eval_steps_per_second": 2.3,
       "step": 750000
     }
   ],
   "max_steps": 1000000,
   "num_train_epochs": 9223372036854775807,
-  "total_flos": 1.2648204730368e+19,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 0.8,
+  "global_step": 800000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 287.549,
       "eval_steps_per_second": 2.3,
       "step": 750000
+    },
+    {
+      "epoch": 0.75,
+      "learning_rate": 1.6014457078461353e-05,
+      "loss": 0.7701,
+      "step": 751000
+    },
+    {
+      "epoch": 0.75,
+      "learning_rate": 1.5893364398662176e-05,
+      "loss": 0.7372,
+      "step": 752000
+    },
+    {
+      "epoch": 0.75,
+      "learning_rate": 1.5772644703565565e-05,
+      "loss": 0.6723,
+      "step": 753000
+    },
+    {
+      "epoch": 0.75,
+      "learning_rate": 1.5652299313342773e-05,
+      "loss": 0.7164,
+      "step": 754000
+    },
+    {
+      "epoch": 0.76,
+      "learning_rate": 1.553232954407171e-05,
+      "loss": 0.6914,
+      "step": 755000
+    },
+    {
+      "epoch": 0.76,
+      "learning_rate": 1.5412736707722537e-05,
+      "loss": 0.6834,
+      "step": 756000
+    },
+    {
+      "epoch": 0.76,
+      "learning_rate": 1.5293522112143373e-05,
+      "loss": 0.695,
+      "step": 757000
+    },
+    {
+      "epoch": 0.76,
+      "learning_rate": 1.517468706104589e-05,
+      "loss": 0.7152,
+      "step": 758000
+    },
+    {
+      "epoch": 0.76,
+      "learning_rate": 1.5056232853991209e-05,
+      "loss": 0.7522,
+      "step": 759000
+    },
+    {
+      "epoch": 0.76,
+      "learning_rate": 1.4938160786375572e-05,
+      "loss": 0.7519,
+      "step": 760000
+    },
+    {
+      "epoch": 0.76,
+      "learning_rate": 1.4820472149416154e-05,
+      "loss": 0.7807,
+      "step": 761000
+    },
+    {
+      "epoch": 0.76,
+      "learning_rate": 1.470316823013707e-05,
+      "loss": 0.8045,
+      "step": 762000
+    },
+    {
+      "epoch": 0.76,
+      "learning_rate": 1.4586250311355132e-05,
+      "loss": 0.8274,
+      "step": 763000
+    },
+    {
+      "epoch": 0.76,
+      "learning_rate": 1.4469719671666043e-05,
+      "loss": 0.8296,
+      "step": 764000
+    },
+    {
+      "epoch": 0.77,
+      "learning_rate": 1.435357758543015e-05,
+      "loss": 0.8388,
+      "step": 765000
+    },
+    {
+      "epoch": 0.77,
+      "learning_rate": 1.4237825322758736e-05,
+      "loss": 0.7847,
+      "step": 766000
+    },
+    {
+      "epoch": 0.77,
+      "learning_rate": 1.412246414949997e-05,
+      "loss": 0.8024,
+      "step": 767000
+    },
+    {
+      "epoch": 0.77,
+      "learning_rate": 1.4007495327225162e-05,
+      "loss": 0.7176,
+      "step": 768000
+    },
+    {
+      "epoch": 0.77,
+      "learning_rate": 1.389292011321498e-05,
+      "loss": 0.7148,
+      "step": 769000
+    },
+    {
+      "epoch": 0.77,
+      "learning_rate": 1.3778739760445552e-05,
+      "loss": 0.707,
+      "step": 770000
+    },
+    {
+      "epoch": 0.77,
+      "learning_rate": 1.3664955517574968e-05,
+      "loss": 0.7007,
+      "step": 771000
+    },
+    {
+      "epoch": 0.77,
+      "learning_rate": 1.3551568628929434e-05,
+      "loss": 0.7072,
+      "step": 772000
+    },
+    {
+      "epoch": 0.77,
+      "learning_rate": 1.343858033448982e-05,
+      "loss": 0.7647,
+      "step": 773000
+    },
+    {
+      "epoch": 0.77,
+      "learning_rate": 1.3325991869878013e-05,
+      "loss": 0.7978,
+      "step": 774000
+    },
+    {
+      "epoch": 0.78,
+      "learning_rate": 1.3213804466343421e-05,
+      "loss": 0.8,
+      "step": 775000
+    },
+    {
+      "epoch": 0.78,
+      "learning_rate": 1.3102019350749528e-05,
+      "loss": 0.8197,
+      "step": 776000
+    },
+    {
+      "epoch": 0.78,
+      "learning_rate": 1.299063774556042e-05,
+      "loss": 0.8255,
+      "step": 777000
+    },
+    {
+      "epoch": 0.78,
+      "learning_rate": 1.2879660868827508e-05,
+      "loss": 0.8455,
+      "step": 778000
+    },
+    {
+      "epoch": 0.78,
+      "learning_rate": 1.2769089934176126e-05,
+      "loss": 0.8561,
+      "step": 779000
+    },
+    {
+      "epoch": 0.78,
+      "learning_rate": 1.2658926150792322e-05,
+      "loss": 0.8587,
+      "step": 780000
+    },
+    {
+      "epoch": 0.78,
+      "learning_rate": 1.2549170723409549e-05,
+      "loss": 0.7954,
+      "step": 781000
+    },
+    {
+      "epoch": 0.78,
+      "learning_rate": 1.243982485229559e-05,
+      "loss": 0.8021,
+      "step": 782000
+    },
+    {
+      "epoch": 0.78,
+      "learning_rate": 1.233088973323937e-05,
+      "loss": 0.7285,
+      "step": 783000
+    },
+    {
+      "epoch": 0.78,
+      "learning_rate": 1.2222366557537911e-05,
+      "loss": 0.7509,
+      "step": 784000
+    },
+    {
+      "epoch": 0.79,
+      "learning_rate": 1.2114256511983274e-05,
+      "loss": 0.7451,
+      "step": 785000
+    },
+    {
+      "epoch": 0.79,
+      "learning_rate": 1.2006560778849578e-05,
+      "loss": 0.7591,
+      "step": 786000
+    },
+    {
+      "epoch": 0.79,
+      "learning_rate": 1.1899280535880119e-05,
+      "loss": 0.8196,
+      "step": 787000
+    },
+    {
+      "epoch": 0.79,
+      "learning_rate": 1.1792416956274444e-05,
+      "loss": 0.8173,
+      "step": 788000
+    },
+    {
+      "epoch": 0.79,
+      "learning_rate": 1.1685971208675539e-05,
+      "loss": 0.8056,
+      "step": 789000
+    },
+    {
+      "epoch": 0.79,
+      "learning_rate": 1.157994445715706e-05,
+      "loss": 0.8131,
+      "step": 790000
+    },
+    {
+      "epoch": 0.79,
+      "learning_rate": 1.1474337861210543e-05,
+      "loss": 0.7835,
+      "step": 791000
+    },
+    {
+      "epoch": 0.79,
+      "learning_rate": 1.1369152575732822e-05,
+      "loss": 0.7698,
+      "step": 792000
+    },
+    {
+      "epoch": 0.79,
+      "learning_rate": 1.1264389751013326e-05,
+      "loss": 0.7947,
+      "step": 793000
+    },
+    {
+      "epoch": 0.79,
+      "learning_rate": 1.1160050532721528e-05,
+      "loss": 0.7808,
+      "step": 794000
+    },
+    {
+      "epoch": 0.8,
+      "learning_rate": 1.1056136061894384e-05,
+      "loss": 0.7543,
+      "step": 795000
+    },
+    {
+      "epoch": 0.8,
+      "learning_rate": 1.095264747492391e-05,
+      "loss": 0.7688,
+      "step": 796000
+    },
+    {
+      "epoch": 0.8,
+      "learning_rate": 1.0849585903544706e-05,
+      "loss": 0.7812,
+      "step": 797000
+    },
+    {
+      "epoch": 0.8,
+      "learning_rate": 1.0746952474821614e-05,
+      "loss": 0.7049,
+      "step": 798000
+    },
+    {
+      "epoch": 0.8,
+      "learning_rate": 1.0644748311137376e-05,
+      "loss": 0.7251,
+      "step": 799000
+    },
+    {
+      "epoch": 0.8,
+      "learning_rate": 1.0542974530180327e-05,
+      "loss": 0.695,
+      "step": 800000
+    },
+    {
+      "epoch": 0.8,
+      "eval_loss": 0.5825644731521606,
+      "eval_runtime": 20.7083,
+      "eval_samples_per_second": 241.45,
+      "eval_steps_per_second": 1.932,
+      "step": 800000
     }
   ],
   "max_steps": 1000000,
   "num_train_epochs": 9223372036854775807,
+  "total_flos": 1.34914183790592e+19,
   "trial_name": null,
   "trial_params": null
 }

last-checkpoint/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:281e1c30b4f4821c0ff87c4a38c66c5325c63ebb8240b3901d44f4cd8f330fc8
-size 3439

 version https://git-lfs.github.com/spec/v1
+oid sha256:56bc6d38ac5da7036b4bce8e3d70d84b767d971c5ea2387cc69adc958b0700f9
+size 3503

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b421ceb551fd425f650a6742be22de59c7f6b297d62820870b0681f67c5a91c4
 size 737971755

 version https://git-lfs.github.com/spec/v1
+oid sha256:a83020031862aea2e988f120ee4fbfdb9e36868ffeeee41e4196243bad5ad70f
 size 737971755

runs/Feb09_18-20-41_t1v-n-0cfb531e-w-0/1675967137.0478177/events.out.tfevents.1675967137.t1v-n-0cfb531e-w-0.3767571.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:1a98c027cf2146aaecfbe0642659eb9d3a2a95a1b4fa3c3d2f9953eef846ee72
+size 5484

runs/Feb09_18-20-41_t1v-n-0cfb531e-w-0/events.out.tfevents.1675967137.t1v-n-0cfb531e-w-0.3767571.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a89903c3ad93724a201222cc39ca9ad19e4291497e25d97bb164b6fca4688679
+size 12096

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:281e1c30b4f4821c0ff87c4a38c66c5325c63ebb8240b3901d44f4cd8f330fc8
-size 3439

 version https://git-lfs.github.com/spec/v1
+oid sha256:56bc6d38ac5da7036b4bce8e3d70d84b767d971c5ea2387cc69adc958b0700f9
+size 3503