Training in progress, epoch 4, checkpoint

Files changed (5) hide show

last-checkpoint/adapter_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:48fe8b2f26913fc41f9e95087b02f179077b30947ecef56fa191ac80e14d5d5d
 size 18980874

 version https://git-lfs.github.com/spec/v1
+oid sha256:30a931970e31877128d96174989ae69c5cf764a1231488aba5b337909dcc6bf6
 size 18980874

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:81d419bf729b5c2510c11f221caf0d619574fd391cf7765bf8f76ec384d769b9
 size 37990394

 version https://git-lfs.github.com/spec/v1
+oid sha256:a8d6544a33222c216fa83a4a8766fe1ff5d812bf04f177b4a4c6220b117615c3
 size 37990394

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:1d901c383106ba63071c6a37a3b311527334983d75f87e1bc2714ad8e32f7cc4
 size 14244

 version https://git-lfs.github.com/spec/v1
+oid sha256:8d287b8eedf8a9c3f7004d656b430686f7a1e8fa3f4ed24a1d9df95c1b7d108b
 size 14244

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:865d9348b669a1fba57b05edd7ec24aa4f68b910fb992649ccb4d5631791663a
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:44b76f17293d37199e93caa9425646aa77bc83cd66879df282548ca48be6676b
 size 1064

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,9 +1,9 @@
 {
-  "best_metric": 2.233867883682251,
-  "best_model_checkpoint": "dq158/pingusPongus/checkpoint-4743",
-  "epoch": 3.0,
   "eval_steps": 500,
-  "global_step": 4743,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -118,13 +118,50 @@
       "eval_steps_per_second": 0.389,
       "eval_translation_length": 53409,
       "step": 4743
     }
   ],
   "logging_steps": 500,
   "max_steps": 47430,
   "num_train_epochs": 30,
   "save_steps": 500,
-  "total_flos": 6.499896809006039e+17,
   "trial_name": null,
   "trial_params": null
 }

 {
+  "best_metric": 2.2097344398498535,
+  "best_model_checkpoint": "dq158/pingusPongus/checkpoint-6324",
+  "epoch": 4.0,
   "eval_steps": 500,
+  "global_step": 6324,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_steps_per_second": 0.389,
       "eval_translation_length": 53409,
       "step": 4743
+    },
+    {
+      "epoch": 3.16,
+      "learning_rate": 8.764077374313499e-05,
+      "loss": 2.3681,
+      "step": 5000
+    },
+    {
+      "epoch": 3.48,
+      "learning_rate": 8.714015715972361e-05,
+      "loss": 2.3441,
+      "step": 5500
+    },
+    {
+      "epoch": 3.8,
+      "learning_rate": 8.659312935118572e-05,
+      "loss": 2.3293,
+      "step": 6000
+    },
+    {
+      "epoch": 4.0,
+      "eval_bleu": 1.0,
+      "eval_brevity_penalty": 1.0,
+      "eval_length_ratio": 1.0,
+      "eval_loss": 2.2097344398498535,
+      "eval_precisions": [
+        1.0,
+        1.0,
+        1.0,
+        1.0
+      ],
+      "eval_reference_length": 53232,
+      "eval_runtime": 904.5886,
+      "eval_samples_per_second": 3.107,
+      "eval_steps_per_second": 0.389,
+      "eval_translation_length": 53232,
+      "step": 6324
     }
   ],
   "logging_steps": 500,
   "max_steps": 47430,
   "num_train_epochs": 30,
   "save_steps": 500,
+  "total_flos": 8.666529078674719e+17,
   "trial_name": null,
   "trial_params": null
 }