Training in progress, step 60, checkpoint

Browse files

Files changed (5) hide show

last-checkpoint/adapter_model.safetensors +1 -1
last-checkpoint/optimizer.pt +1 -1
last-checkpoint/rng_state.pth +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +63 -3

last-checkpoint/adapter_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ba71b16aff5e5df8f66d1fcb872f4b56c8e27344e7ed3bcf22efb316b86d0a2f
 size 83945296

 version https://git-lfs.github.com/spec/v1
+oid sha256:376a3d27f0b1944494854ef53f3cae507ae395c3d1eb4a9fb04b4918e1482b14
 size 83945296

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:68acdab516bd358e2bd421da2a32c4da7306cbafba519d067019ebc079363f82
 size 42545748

 version https://git-lfs.github.com/spec/v1
+oid sha256:7a66101811aa26237703ee0b600450fa3d9faaa7c72ad1d2093f56e124c8dd86
 size 42545748

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:fb666093d54c6ea7061dd8f6ce0161fe9011e0b6517a61dc248791ee21e8e12d
 size 14244

 version https://git-lfs.github.com/spec/v1
+oid sha256:babf9cef0f970e1cd241f9533a5b0bc052a39fc9df617e7f31209a9691bd42d1
 size 14244

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ff3806b6ededc075c4c89012dc49cff3604a5f3bc56562d72a0f71b6ec838696
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:87f5541cd8b8cc2355cb28b7b43b87c2e735f1841d8477f8ed4c15392845734c
 size 1064

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,9 +1,9 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 0.02,
   "eval_steps": 1000,
-  "global_step": 50,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -307,13 +307,73 @@
       "learning_rate": 0.00010526315789473685,
       "loss": 1.5211,
       "step": 50
     }
   ],
   "logging_steps": 1,
   "max_steps": 100,
   "num_train_epochs": 1,
   "save_steps": 10,
-  "total_flos": 3055618882191360.0,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 0.024,
   "eval_steps": 1000,
+  "global_step": 60,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "learning_rate": 0.00010526315789473685,
       "loss": 1.5211,
       "step": 50
+    },
+    {
+      "epoch": 0.02,
+      "learning_rate": 0.00010315789473684211,
+      "loss": 1.8625,
+      "step": 51
+    },
+    {
+      "epoch": 0.02,
+      "learning_rate": 0.00010105263157894738,
+      "loss": 1.7274,
+      "step": 52
+    },
+    {
+      "epoch": 0.02,
+      "learning_rate": 9.894736842105263e-05,
+      "loss": 1.6251,
+      "step": 53
+    },
+    {
+      "epoch": 0.02,
+      "learning_rate": 9.68421052631579e-05,
+      "loss": 1.5311,
+      "step": 54
+    },
+    {
+      "epoch": 0.02,
+      "learning_rate": 9.473684210526316e-05,
+      "loss": 1.5397,
+      "step": 55
+    },
+    {
+      "epoch": 0.02,
+      "learning_rate": 9.263157894736843e-05,
+      "loss": 1.8251,
+      "step": 56
+    },
+    {
+      "epoch": 0.02,
+      "learning_rate": 9.052631578947369e-05,
+      "loss": 1.7583,
+      "step": 57
+    },
+    {
+      "epoch": 0.02,
+      "learning_rate": 8.842105263157894e-05,
+      "loss": 1.6476,
+      "step": 58
+    },
+    {
+      "epoch": 0.02,
+      "learning_rate": 8.631578947368421e-05,
+      "loss": 1.9871,
+      "step": 59
+    },
+    {
+      "epoch": 0.02,
+      "learning_rate": 8.421052631578948e-05,
+      "loss": 1.6805,
+      "step": 60
     }
   ],
   "logging_steps": 1,
   "max_steps": 100,
   "num_train_epochs": 1,
   "save_steps": 10,
+  "total_flos": 3532725037301760.0,
   "trial_name": null,
   "trial_params": null
 }