Training in progress, step 24, checkpoint

Browse files

Files changed (4) hide show

last-checkpoint/adapter_model.safetensors +1 -1
last-checkpoint/optimizer.pt +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +74 -2

last-checkpoint/adapter_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b23b63a1ba8da58de7be23d27a64b09e82a4a5a5184f6f73c8e716906a1444ec
 size 590925768

 version https://git-lfs.github.com/spec/v1
+oid sha256:821c41d055ae43f59583b224aef0fe6ca8460f3f504843f558ed73ec4187c4ec
 size 590925768

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e6f426b7b1c120fd6698ec8e3ddf7b15450626dd3e1c5dc7e97ad1ef6c817211
 size 296481140

 version https://git-lfs.github.com/spec/v1
+oid sha256:15de9aec4da225a8f0e059686a990002242615ab62bd169ea8cf051f430d8003
 size 296481140

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b022caf5394258d9701ac5c9c6bf11912e3fbbf6b0f72e2f43a2a5772c71d718
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:b1f07cfba84b1c996956e2762438ed7721853a912845f8535ca55de1e28dc131
 size 1064

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,9 +1,9 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 0.02922174280300436,
   "eval_steps": 500,
-  "global_step": 20,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -367,6 +367,78 @@
       "rewards/margins": 0.0006919947918504477,
       "rewards/rejected": -0.1387580782175064,
       "step": 20
     }
   ],
   "logging_steps": 1.0,

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 0.03506609136360523,
   "eval_steps": 500,
+  "global_step": 24,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "rewards/margins": 0.0006919947918504477,
       "rewards/rejected": -0.1387580782175064,
       "step": 20
+    },
+    {
+      "epoch": 0.030682829943154577,
+      "grad_norm": 0.5434465408325195,
+      "learning_rate": 9.989452106587406e-06,
+      "log_odds_chosen": 0.012862562201917171,
+      "log_odds_ratio": -0.7206666469573975,
+      "logits/chosen": -2.1785006523132324,
+      "logits/rejected": -2.181265354156494,
+      "logps/chosen": -1.2523807287216187,
+      "logps/rejected": -1.2531023025512695,
+      "loss": 1.5781,
+      "nll_loss": 1.5060465335845947,
+      "rewards/accuracies": 0.421875,
+      "rewards/chosen": -0.1252380609512329,
+      "rewards/margins": 7.216550875455141e-05,
+      "rewards/rejected": -0.1253102421760559,
+      "step": 21
+    },
+    {
+      "epoch": 0.032143917083304795,
+      "grad_norm": 0.6211642026901245,
+      "learning_rate": 9.987892079051531e-06,
+      "log_odds_chosen": 0.012624351307749748,
+      "log_odds_ratio": -0.7291357517242432,
+      "logits/chosen": -2.179482936859131,
+      "logits/rejected": -2.176547050476074,
+      "logps/chosen": -1.3581693172454834,
+      "logps/rejected": -1.3609216213226318,
+      "loss": 1.6565,
+      "nll_loss": 1.5835901498794556,
+      "rewards/accuracies": 0.359375,
+      "rewards/chosen": -0.13581693172454834,
+      "rewards/margins": 0.0002752433065325022,
+      "rewards/rejected": -0.1360921710729599,
+      "step": 22
+    },
+    {
+      "epoch": 0.03360500422345501,
+      "grad_norm": 0.769701361656189,
+      "learning_rate": 9.986224643009375e-06,
+      "log_odds_chosen": 0.03776140883564949,
+      "log_odds_ratio": -0.6954489946365356,
+      "logits/chosen": -2.1131434440612793,
+      "logits/rejected": -2.1170055866241455,
+      "logps/chosen": -1.2192529439926147,
+      "logps/rejected": -1.2428308725357056,
+      "loss": 1.519,
+      "nll_loss": 1.4494192600250244,
+      "rewards/accuracies": 0.453125,
+      "rewards/chosen": -0.12192529439926147,
+      "rewards/margins": 0.0023577904794365168,
+      "rewards/rejected": -0.1242830902338028,
+      "step": 23
+    },
+    {
+      "epoch": 0.03506609136360523,
+      "grad_norm": 0.6579698324203491,
+      "learning_rate": 9.984449834367251e-06,
+      "log_odds_chosen": -0.08287765085697174,
+      "log_odds_ratio": -0.7655948400497437,
+      "logits/chosen": -2.117600440979004,
+      "logits/rejected": -2.118288993835449,
+      "logps/chosen": -1.3066436052322388,
+      "logps/rejected": -1.2814935445785522,
+      "loss": 1.5987,
+      "nll_loss": 1.5221776962280273,
+      "rewards/accuracies": 0.46875,
+      "rewards/chosen": -0.13066436350345612,
+      "rewards/margins": -0.0025150016881525517,
+      "rewards/rejected": -0.1281493604183197,
+      "step": 24
     }
   ],
   "logging_steps": 1.0,