Training in progress, step 600, checkpoint

Files changed (5) hide show

last-checkpoint/adapter_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6b8eb123499e8392ba5ad821bb9da8fbcdf4df19d8e1c76b9870fe463ae04b36
 size 250422888

 version https://git-lfs.github.com/spec/v1
+oid sha256:8ca8f20510733b4d16dd7297194631c192e39f8530581b5af76a793ac04e324f
 size 250422888

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:31fbc12714c21256e870a21356ebcef472e473aa422f6db9b9bd12331cc5519f
 size 126034975

 version https://git-lfs.github.com/spec/v1
+oid sha256:44bd1c169b13957c006697fd590a7f0d5ec2307759e4b514b0b37b9fd2b34b72
 size 126034975

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:13ea66d8c66a5650930e65e8658c9e457131927f39417fd12c5000d0638f1d41
 size 14575

 version https://git-lfs.github.com/spec/v1
+oid sha256:995d3a0dcc194d6d7316c3e62a9316c8f6a4ff574e8e486c51d021cc9b08807c
 size 14575

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:5efc416a6883409dd7ab6f5c779e107c7c2baa7af6e12ed9fbd9dd73b8b20784
 size 627

 version https://git-lfs.github.com/spec/v1
+oid sha256:9c1a2ac1c11599601eeac95feb1dbfd49ec5c625e61dcce18b3f094491f9cf2d
 size 627

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,9 +1,9 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 6.097560975609756,
   "eval_steps": 100,
-  "global_step": 500,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -72,13 +72,26 @@
       "eval_samples_per_second": 8.523,
       "eval_steps_per_second": 0.154,
       "step": 500
     }
   ],
   "logging_steps": 100,
   "max_steps": 656,
   "num_train_epochs": 8,
   "save_steps": 100,
-  "total_flos": 6.442331252195328e+17,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 7.317073170731708,
   "eval_steps": 100,
+  "global_step": 600,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 8.523,
       "eval_steps_per_second": 0.154,
       "step": 500
+    },
+    {
+      "epoch": 7.32,
+      "learning_rate": 0.0002,
+      "loss": 0.0281,
+      "step": 600
+    },
+    {
+      "epoch": 7.32,
+      "eval_runtime": 32.3958,
+      "eval_samples_per_second": 8.52,
+      "eval_steps_per_second": 0.154,
+      "step": 600
     }
   ],
   "logging_steps": 100,
   "max_steps": 656,
   "num_train_epochs": 8,
   "save_steps": 100,
+  "total_flos": 7.731362690236416e+17,
   "trial_name": null,
   "trial_params": null
 }