Training in progress, step 7724, checkpoint

Browse files

Files changed (16) hide show

last-checkpoint/adapter_model.safetensors +1 -1
last-checkpoint/global_step7724/bf16_zero_pp_rank_0_mp_rank_00_optim_states.pt +3 -0
last-checkpoint/global_step7724/bf16_zero_pp_rank_1_mp_rank_00_optim_states.pt +3 -0
last-checkpoint/global_step7724/bf16_zero_pp_rank_2_mp_rank_00_optim_states.pt +3 -0
last-checkpoint/global_step7724/bf16_zero_pp_rank_3_mp_rank_00_optim_states.pt +3 -0
last-checkpoint/global_step7724/zero_pp_rank_0_mp_rank_00_model_states.pt +3 -0
last-checkpoint/global_step7724/zero_pp_rank_1_mp_rank_00_model_states.pt +3 -0
last-checkpoint/global_step7724/zero_pp_rank_2_mp_rank_00_model_states.pt +3 -0
last-checkpoint/global_step7724/zero_pp_rank_3_mp_rank_00_model_states.pt +3 -0
last-checkpoint/latest +1 -1
last-checkpoint/rng_state_0.pth +1 -1
last-checkpoint/rng_state_1.pth +1 -1
last-checkpoint/rng_state_2.pth +1 -1
last-checkpoint/rng_state_3.pth +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +2276 -4

last-checkpoint/adapter_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:979469bfc02cfe29f144d2bf87e20b49007341327b81e1b4915828cfa0aabd25
 size 10107504

 version https://git-lfs.github.com/spec/v1
+oid sha256:cc3067f6f49803d6483ed250997366f38d0ab2f09b2da22d2fabe6ac0fb75ff6
 size 10107504

last-checkpoint/global_step7724/bf16_zero_pp_rank_0_mp_rank_00_optim_states.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:97c6b7bff0e93774276654dfabe2789287685eff81eb0356b3c4e432d008879b
+size 15142384

last-checkpoint/global_step7724/bf16_zero_pp_rank_1_mp_rank_00_optim_states.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e0ae9c9e58dc038648826e0b8f756489ad36eeb01e206fc42eeb3371aa7ab4f8
+size 15142384

last-checkpoint/global_step7724/bf16_zero_pp_rank_2_mp_rank_00_optim_states.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:873d603f9ba9580b5e130bff47347dcc9654a60665ff32cf88b22531d21ad096
+size 15142384

last-checkpoint/global_step7724/bf16_zero_pp_rank_3_mp_rank_00_optim_states.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b48442fffd98f620e79aec539490b8f3738cb7abd39f3ed80c2070d65eac7eb7
+size 15142384

last-checkpoint/global_step7724/zero_pp_rank_0_mp_rank_00_model_states.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:99fd6c868aa11063fc90b4a235b658c1f06846579371a1ca435a3752fc94024d
+size 133406

last-checkpoint/global_step7724/zero_pp_rank_1_mp_rank_00_model_states.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9a4b34b591a64db0bd036adac493e5bd479a400986798fb848eab6c0451bc8b0
+size 133406

last-checkpoint/global_step7724/zero_pp_rank_2_mp_rank_00_model_states.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f591073404fd55b339bcc2665c6fbfbcea9d2cbdc3cec4ef877565ba3e794c9e
+size 133406

last-checkpoint/global_step7724/zero_pp_rank_3_mp_rank_00_model_states.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:454aca661de8e2cda3725c47af8a9a9cdeac92329976320a37ebc99b58ff8fbe
+size 133406

last-checkpoint/latest CHANGED Viewed

	@@ -1 +1 @@
1	- ~~global_step7500~~


1	+ global_step7724

last-checkpoint/rng_state_0.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:513163af87c845748d49a54861f9a7446776757349da481d20db863e8d77fa45
 size 14960

 version https://git-lfs.github.com/spec/v1
+oid sha256:365955c51abdb92c80c42d93201c5209f863b3153268eb4a953da4966f1e43a5
 size 14960

last-checkpoint/rng_state_1.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:5645bb5e422d71428886b99f3b5df78bd93cb33490f797fa943ea049b0f38f4b
 size 14960

 version https://git-lfs.github.com/spec/v1
+oid sha256:833cfceec5f4c1e2e2fd595b8054119e44fc059867ce43ae83edc5c5ad6c4340
 size 14960

last-checkpoint/rng_state_2.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:2547f43c71665cfb6f662c505498382da2da8529aec63588e796127e0c6f5854
 size 14960

 version https://git-lfs.github.com/spec/v1
+oid sha256:bf0517c56512d4ae7a3361a1e8dacb66d486d479cf260ca1d6f51f6ee19825e3
 size 14960

last-checkpoint/rng_state_3.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:868814318d2769863aeb40a8ce6e51e7af5a8874a8e98e22e80f4877b730fc72
 size 14960

 version https://git-lfs.github.com/spec/v1
+oid sha256:7ed8eaad9e0b09f1cddb62096ef671eb06bf7a4be830ed6580db5b8e23e266ae
 size 14960

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:93d09d2963b600508f0d1a1632ed080b98e9d42e0115a809cba262f21d1b627c
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:f3270c748caccc6a16e6d4f08adacc13be568ae6a10d730ba03d05068ed26e9d
 size 1064

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,9 +1,9 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 0.9709680551509855,
   "eval_steps": 5,
-  "global_step": 7500,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -76523,6 +76523,2278 @@
       "eval_samples_per_second": 3.173,
       "eval_steps_per_second": 0.216,
       "step": 7500
     }
   ],
   "logging_steps": 1,
@@ -76537,12 +78809,12 @@
         "should_evaluate": false,
         "should_log": false,
         "should_save": true,
-        "should_training_stop": false
       },
       "attributes": {}
     }
   },
-  "total_flos": 6305055549194240.0,
   "train_batch_size": 4,
   "trial_name": null,
   "trial_params": null

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 0.9999676343981616,
   "eval_steps": 5,
+  "global_step": 7724,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 3.173,
       "eval_steps_per_second": 0.216,
       "step": 7500
+    },
+    {
+      "epoch": 0.971097517558339,
+      "grad_norm": 2.078256325407057,
+      "learning_rate": 3.171737588503407e-09,
+      "loss": 2.4272,
+      "step": 7501
+    },
+    {
+      "epoch": 0.9712269799656925,
+      "grad_norm": 1.366999089040965,
+      "learning_rate": 3.1433791070100555e-09,
+      "loss": 2.229,
+      "step": 7502
+    },
+    {
+      "epoch": 0.971356442373046,
+      "grad_norm": 1.8412842996905656,
+      "learning_rate": 3.1151476523359064e-09,
+      "loss": 2.374,
+      "step": 7503
+    },
+    {
+      "epoch": 0.9714859047803994,
+      "grad_norm": 2.4036313021269984,
+      "learning_rate": 3.0870432302479435e-09,
+      "loss": 2.552,
+      "step": 7504
+    },
+    {
+      "epoch": 0.9716153671877529,
+      "grad_norm": 1.3319207705837204,
+      "learning_rate": 3.059065846487061e-09,
+      "loss": 2.4368,
+      "step": 7505
+    },
+    {
+      "epoch": 0.9716153671877529,
+      "eval_PRM Accuracy": 0.2358490566037736,
+      "eval_PRM F1": 0.047058823529411764,
+      "eval_PRM F1 AUC": 0.5120481927710844,
+      "eval_PRM F1 Neg": 0.36220472440944884,
+      "eval_PRM NPV": 0.22115384615384615,
+      "eval_PRM Precision": 1.0,
+      "eval_PRM Recall": 0.024096385542168676,
+      "eval_PRM Specificty": 1.0,
+      "eval_loss": 1.4964932203292847,
+      "eval_runtime": 14.552,
+      "eval_samples_per_second": 3.024,
+      "eval_steps_per_second": 0.206,
+      "step": 7505
+    },
+    {
+      "epoch": 0.9717448295951063,
+      "grad_norm": 2.604357541325846,
+      "learning_rate": 3.031215506768062e-09,
+      "loss": 2.4111,
+      "step": 7506
+    },
+    {
+      "epoch": 0.9718742920024598,
+      "grad_norm": 1.7566724147974662,
+      "learning_rate": 3.003492216780077e-09,
+      "loss": 2.4978,
+      "step": 7507
+    },
+    {
+      "epoch": 0.9720037544098132,
+      "grad_norm": 1.8860731801998685,
+      "learning_rate": 2.975895982186075e-09,
+      "loss": 2.1368,
+      "step": 7508
+    },
+    {
+      "epoch": 0.9721332168171667,
+      "grad_norm": 1.336728000590379,
+      "learning_rate": 2.948426808623145e-09,
+      "loss": 2.3132,
+      "step": 7509
+    },
+    {
+      "epoch": 0.9722626792245201,
+      "grad_norm": 1.6261016992599011,
+      "learning_rate": 2.9210847017024922e-09,
+      "loss": 2.2693,
+      "step": 7510
+    },
+    {
+      "epoch": 0.9722626792245201,
+      "eval_PRM Accuracy": 0.2358490566037736,
+      "eval_PRM F1": 0.047058823529411764,
+      "eval_PRM F1 AUC": 0.5120481927710844,
+      "eval_PRM F1 Neg": 0.36220472440944884,
+      "eval_PRM NPV": 0.22115384615384615,
+      "eval_PRM Precision": 1.0,
+      "eval_PRM Recall": 0.024096385542168676,
+      "eval_PRM Specificty": 1.0,
+      "eval_loss": 1.495072841644287,
+      "eval_runtime": 14.6337,
+      "eval_samples_per_second": 3.007,
+      "eval_steps_per_second": 0.205,
+      "step": 7510
+    },
+    {
+      "epoch": 0.9723921416318736,
+      "grad_norm": 1.7337031603610027,
+      "learning_rate": 2.893869667009233e-09,
+      "loss": 2.573,
+      "step": 7511
+    },
+    {
+      "epoch": 0.9725216040392272,
+      "grad_norm": 1.516881266320023,
+      "learning_rate": 2.866781710102601e-09,
+      "loss": 2.4393,
+      "step": 7512
+    },
+    {
+      "epoch": 0.9726510664465806,
+      "grad_norm": 1.778019440023385,
+      "learning_rate": 2.839820836515947e-09,
+      "loss": 2.4497,
+      "step": 7513
+    },
+    {
+      "epoch": 0.9727805288539341,
+      "grad_norm": 1.649562667349022,
+      "learning_rate": 2.812987051756394e-09,
+      "loss": 2.3696,
+      "step": 7514
+    },
+    {
+      "epoch": 0.9729099912612875,
+      "grad_norm": 1.6709675287516073,
+      "learning_rate": 2.78628036130546e-09,
+      "loss": 2.7583,
+      "step": 7515
+    },
+    {
+      "epoch": 0.9729099912612875,
+      "eval_PRM Accuracy": 0.2358490566037736,
+      "eval_PRM F1": 0.047058823529411764,
+      "eval_PRM F1 AUC": 0.5120481927710844,
+      "eval_PRM F1 Neg": 0.36220472440944884,
+      "eval_PRM NPV": 0.22115384615384615,
+      "eval_PRM Precision": 1.0,
+      "eval_PRM Recall": 0.024096385542168676,
+      "eval_PRM Specificty": 1.0,
+      "eval_loss": 1.4964045286178589,
+      "eval_runtime": 14.1338,
+      "eval_samples_per_second": 3.113,
+      "eval_steps_per_second": 0.212,
+      "step": 7515
+    },
+    {
+      "epoch": 0.973039453668641,
+      "grad_norm": 1.208623897904988,
+      "learning_rate": 2.7597007706184344e-09,
+      "loss": 2.2378,
+      "step": 7516
+    },
+    {
+      "epoch": 0.9731689160759944,
+      "grad_norm": 1.3760642333243103,
+      "learning_rate": 2.7332482851247926e-09,
+      "loss": 2.4258,
+      "step": 7517
+    },
+    {
+      "epoch": 0.9732983784833479,
+      "grad_norm": 3.037334589617975,
+      "learning_rate": 2.7069229102279217e-09,
+      "loss": 2.3164,
+      "step": 7518
+    },
+    {
+      "epoch": 0.9734278408907013,
+      "grad_norm": 1.5660663366500944,
+      "learning_rate": 2.680724651305325e-09,
+      "loss": 2.1655,
+      "step": 7519
+    },
+    {
+      "epoch": 0.9735573032980548,
+      "grad_norm": 2.3157849481641852,
+      "learning_rate": 2.6546535137086244e-09,
+      "loss": 2.5334,
+      "step": 7520
+    },
+    {
+      "epoch": 0.9735573032980548,
+      "eval_PRM Accuracy": 0.2358490566037736,
+      "eval_PRM F1": 0.047058823529411764,
+      "eval_PRM F1 AUC": 0.5120481927710844,
+      "eval_PRM F1 Neg": 0.36220472440944884,
+      "eval_PRM NPV": 0.22115384615384615,
+      "eval_PRM Precision": 1.0,
+      "eval_PRM Recall": 0.024096385542168676,
+      "eval_PRM Specificty": 1.0,
+      "eval_loss": 1.4964932203292847,
+      "eval_runtime": 14.4152,
+      "eval_samples_per_second": 3.052,
+      "eval_steps_per_second": 0.208,
+      "step": 7520
+    },
+    {
+      "epoch": 0.9736867657054082,
+      "grad_norm": 1.6032188100029758,
+      "learning_rate": 2.6287095027632824e-09,
+      "loss": 2.3384,
+      "step": 7521
+    },
+    {
+      "epoch": 0.9738162281127618,
+      "grad_norm": 1.6009070614900751,
+      "learning_rate": 2.6028926237689488e-09,
+      "loss": 2.4028,
+      "step": 7522
+    },
+    {
+      "epoch": 0.9739456905201153,
+      "grad_norm": 1.935103516636611,
+      "learning_rate": 2.577202881999183e-09,
+      "loss": 2.2874,
+      "step": 7523
+    },
+    {
+      "epoch": 0.9740751529274687,
+      "grad_norm": 1.8155538775672537,
+      "learning_rate": 2.5516402827016617e-09,
+      "loss": 2.3831,
+      "step": 7524
+    },
+    {
+      "epoch": 0.9742046153348222,
+      "grad_norm": 1.0483947077967555,
+      "learning_rate": 2.5262048310980418e-09,
+      "loss": 2.1833,
+      "step": 7525
+    },
+    {
+      "epoch": 0.9742046153348222,
+      "eval_PRM Accuracy": 0.2358490566037736,
+      "eval_PRM F1": 0.047058823529411764,
+      "eval_PRM F1 AUC": 0.5120481927710844,
+      "eval_PRM F1 Neg": 0.36220472440944884,
+      "eval_PRM NPV": 0.22115384615384615,
+      "eval_PRM Precision": 1.0,
+      "eval_PRM Recall": 0.024096385542168676,
+      "eval_PRM Specificty": 1.0,
+      "eval_loss": 1.495805263519287,
+      "eval_runtime": 14.1041,
+      "eval_samples_per_second": 3.12,
+      "eval_steps_per_second": 0.213,
+      "step": 7525
+    },
+    {
+      "epoch": 0.9743340777421756,
+      "grad_norm": 1.552266890430507,
+      "learning_rate": 2.500896532384098e-09,
+      "loss": 2.1396,
+      "step": 7526
+    },
+    {
+      "epoch": 0.9744635401495291,
+      "grad_norm": 4.162519199111511,
+      "learning_rate": 2.4757153917295136e-09,
+      "loss": 3.0793,
+      "step": 7527
+    },
+    {
+      "epoch": 0.9745930025568825,
+      "grad_norm": 1.4020772771060606,
+      "learning_rate": 2.4506614142780216e-09,
+      "loss": 2.2017,
+      "step": 7528
+    },
+    {
+      "epoch": 0.974722464964236,
+      "grad_norm": 2.257257302308101,
+      "learning_rate": 2.4257346051474034e-09,
+      "loss": 2.3549,
+      "step": 7529
+    },
+    {
+      "epoch": 0.9748519273715894,
+      "grad_norm": 2.304261799764049,
+      "learning_rate": 2.400934969429558e-09,
+      "loss": 2.4275,
+      "step": 7530
+    },
+    {
+      "epoch": 0.9748519273715894,
+      "eval_PRM Accuracy": 0.2358490566037736,
+      "eval_PRM F1": 0.047058823529411764,
+      "eval_PRM F1 AUC": 0.5120481927710844,
+      "eval_PRM F1 Neg": 0.36220472440944884,
+      "eval_PRM NPV": 0.22115384615384615,
+      "eval_PRM Precision": 1.0,
+      "eval_PRM Recall": 0.024096385542168676,
+      "eval_PRM Specificty": 1.0,
+      "eval_loss": 1.495072841644287,
+      "eval_runtime": 13.7187,
+      "eval_samples_per_second": 3.207,
+      "eval_steps_per_second": 0.219,
+      "step": 7530
+    },
+    {
+      "epoch": 0.9749813897789429,
+      "grad_norm": 1.358154053410943,
+      "learning_rate": 2.376262512190225e-09,
+      "loss": 2.2069,
+      "step": 7531
+    },
+    {
+      "epoch": 0.9751108521862965,
+      "grad_norm": 1.9448873246460772,
+      "learning_rate": 2.351717238469331e-09,
+      "loss": 2.4498,
+      "step": 7532
+    },
+    {
+      "epoch": 0.9752403145936499,
+      "grad_norm": 2.323208439137572,
+      "learning_rate": 2.3272991532807126e-09,
+      "loss": 2.5518,
+      "step": 7533
+    },
+    {
+      "epoch": 0.9753697770010034,
+      "grad_norm": 1.9000478401818919,
+      "learning_rate": 2.3030082616121858e-09,
+      "loss": 2.2683,
+      "step": 7534
+    },
+    {
+      "epoch": 0.9754992394083568,
+      "grad_norm": 2.0009142246658937,
+      "learning_rate": 2.2788445684256836e-09,
+      "loss": 2.2664,
+      "step": 7535
+    },
+    {
+      "epoch": 0.9754992394083568,
+      "eval_PRM Accuracy": 0.2358490566037736,
+      "eval_PRM F1": 0.047058823529411764,
+      "eval_PRM F1 AUC": 0.5120481927710844,
+      "eval_PRM F1 Neg": 0.36220472440944884,
+      "eval_PRM NPV": 0.22115384615384615,
+      "eval_PRM Precision": 1.0,
+      "eval_PRM Recall": 0.024096385542168676,
+      "eval_PRM Specificty": 1.0,
+      "eval_loss": 1.4978693723678589,
+      "eval_runtime": 14.3015,
+      "eval_samples_per_second": 3.077,
+      "eval_steps_per_second": 0.21,
+      "step": 7535
+    },
+    {
+      "epoch": 0.9756287018157103,
+      "grad_norm": 1.3166239883775896,
+      "learning_rate": 2.254808078657189e-09,
+      "loss": 2.3547,
+      "step": 7536
+    },
+    {
+      "epoch": 0.9757581642230637,
+      "grad_norm": 3.8384585910489326,
+      "learning_rate": 2.230898797216663e-09,
+      "loss": 2.3691,
+      "step": 7537
+    },
+    {
+      "epoch": 0.9758876266304172,
+      "grad_norm": 1.5529322232040648,
+      "learning_rate": 2.207116728987976e-09,
+      "loss": 2.4724,
+      "step": 7538
+    },
+    {
+      "epoch": 0.9760170890377706,
+      "grad_norm": 1.2127774713992632,
+      "learning_rate": 2.1834618788291183e-09,
+      "loss": 2.2393,
+      "step": 7539
+    },
+    {
+      "epoch": 0.9761465514451241,
+      "grad_norm": 2.1174450047835274,
+      "learning_rate": 2.1599342515720573e-09,
+      "loss": 2.335,
+      "step": 7540
+    },
+    {
+      "epoch": 0.9761465514451241,
+      "eval_PRM Accuracy": 0.2358490566037736,
+      "eval_PRM F1": 0.047058823529411764,
+      "eval_PRM F1 AUC": 0.5120481927710844,
+      "eval_PRM F1 Neg": 0.36220472440944884,
+      "eval_PRM NPV": 0.22115384615384615,
+      "eval_PRM Precision": 1.0,
+      "eval_PRM Recall": 0.024096385542168676,
+      "eval_PRM Specificty": 1.0,
+      "eval_loss": 1.493696689605713,
+      "eval_runtime": 14.3755,
+      "eval_samples_per_second": 3.061,
+      "eval_steps_per_second": 0.209,
+      "step": 7540
+    },
+    {
+      "epoch": 0.9762760138524776,
+      "grad_norm": 2.483136951823826,
+      "learning_rate": 2.136533852022879e-09,
+      "loss": 2.4524,
+      "step": 7541
+    },
+    {
+      "epoch": 0.9764054762598311,
+      "grad_norm": 1.5511048057136474,
+      "learning_rate": 2.11326068496151e-09,
+      "loss": 2.4346,
+      "step": 7542
+    },
+    {
+      "epoch": 0.9765349386671845,
+      "grad_norm": 1.8425095487094147,
+      "learning_rate": 2.0901147551419948e-09,
+      "loss": 2.3542,
+      "step": 7543
+    },
+    {
+      "epoch": 0.976664401074538,
+      "grad_norm": 1.591283586442896,
+      "learning_rate": 2.0670960672923567e-09,
+      "loss": 2.2773,
+      "step": 7544
+    },
+    {
+      "epoch": 0.9767938634818915,
+      "grad_norm": 3.219894890994954,
+      "learning_rate": 2.044204626114599e-09,
+      "loss": 2.686,
+      "step": 7545
+    },
+    {
+      "epoch": 0.9767938634818915,
+      "eval_PRM Accuracy": 0.2358490566037736,
+      "eval_PRM F1": 0.047058823529411764,
+      "eval_PRM F1 AUC": 0.5120481927710844,
+      "eval_PRM F1 Neg": 0.36220472440944884,
+      "eval_PRM NPV": 0.22115384615384615,
+      "eval_PRM Precision": 1.0,
+      "eval_PRM Recall": 0.024096385542168676,
+      "eval_PRM Specificty": 1.0,
+      "eval_loss": 1.4943181276321411,
+      "eval_runtime": 14.3109,
+      "eval_samples_per_second": 3.075,
+      "eval_steps_per_second": 0.21,
+      "step": 7545
+    },
+    {
+      "epoch": 0.9769233258892449,
+      "grad_norm": 1.6948323938636074,
+      "learning_rate": 2.021440436284841e-09,
+      "loss": 2.5454,
+      "step": 7546
+    },
+    {
+      "epoch": 0.9770527882965984,
+      "grad_norm": 2.0809224454371016,
+      "learning_rate": 1.9988035024529756e-09,
+      "loss": 2.2063,
+      "step": 7547
+    },
+    {
+      "epoch": 0.9771822507039518,
+      "grad_norm": 1.8854420394243903,
+      "learning_rate": 1.97629382924322e-09,
+      "loss": 2.2332,
+      "step": 7548
+    },
+    {
+      "epoch": 0.9773117131113053,
+      "grad_norm": 2.5643896611272123,
+      "learning_rate": 1.9539114212535625e-09,
+      "loss": 2.293,
+      "step": 7549
+    },
+    {
+      "epoch": 0.9774411755186587,
+      "grad_norm": 1.1925655779849842,
+      "learning_rate": 1.931656283056041e-09,
+      "loss": 2.1436,
+      "step": 7550
+    },
+    {
+      "epoch": 0.9774411755186587,
+      "eval_PRM Accuracy": 0.2358490566037736,
+      "eval_PRM F1": 0.047058823529411764,
+      "eval_PRM F1 AUC": 0.5120481927710844,
+      "eval_PRM F1 Neg": 0.36220472440944884,
+      "eval_PRM NPV": 0.22115384615384615,
+      "eval_PRM Precision": 1.0,
+      "eval_PRM Recall": 0.024096385542168676,
+      "eval_PRM Specificty": 1.0,
+      "eval_loss": 1.495649814605713,
+      "eval_runtime": 14.3042,
+      "eval_samples_per_second": 3.076,
+      "eval_steps_per_second": 0.21,
+      "step": 7550
+    },
+    {
+      "epoch": 0.9775706379260123,
+      "grad_norm": 6.1310483327674925,
+      "learning_rate": 1.90952841919681e-09,
+      "loss": 2.8223,
+      "step": 7551
+    },
+    {
+      "epoch": 0.9777001003333657,
+      "grad_norm": 1.8490057934229254,
+      "learning_rate": 1.887527834195796e-09,
+      "loss": 2.2754,
+      "step": 7552
+    },
+    {
+      "epoch": 0.9778295627407192,
+      "grad_norm": 1.9545709254230654,
+      "learning_rate": 1.8656545325471122e-09,
+      "loss": 2.3342,
+      "step": 7553
+    },
+    {
+      "epoch": 0.9779590251480726,
+      "grad_norm": 1.7527908462995896,
+      "learning_rate": 1.8439085187189205e-09,
+      "loss": 2.324,
+      "step": 7554
+    },
+    {
+      "epoch": 0.9780884875554261,
+      "grad_norm": 1.8819808845260853,
+      "learning_rate": 1.822289797153154e-09,
+      "loss": 2.3325,
+      "step": 7555
+    },
+    {
+      "epoch": 0.9780884875554261,
+      "eval_PRM Accuracy": 0.2358490566037736,
+      "eval_PRM F1": 0.047058823529411764,
+      "eval_PRM F1 AUC": 0.5120481927710844,
+      "eval_PRM F1 Neg": 0.36220472440944884,
+      "eval_PRM NPV": 0.22115384615384615,
+      "eval_PRM Precision": 1.0,
+      "eval_PRM Recall": 0.024096385542168676,
+      "eval_PRM Specificty": 1.0,
+      "eval_loss": 1.4964932203292847,
+      "eval_runtime": 13.6691,
+      "eval_samples_per_second": 3.219,
+      "eval_steps_per_second": 0.219,
+      "step": 7555
+    },
+    {
+      "epoch": 0.9782179499627796,
+      "grad_norm": 1.9981064278922835,
+      "learning_rate": 1.8007983722660021e-09,
+      "loss": 2.519,
+      "step": 7556
+    },
+    {
+      "epoch": 0.978347412370133,
+      "grad_norm": 2.209991202418474,
+      "learning_rate": 1.7794342484474259e-09,
+      "loss": 2.4434,
+      "step": 7557
+    },
+    {
+      "epoch": 0.9784768747774865,
+      "grad_norm": 2.282220337288573,
+      "learning_rate": 1.758197430061434e-09,
+      "loss": 2.5867,
+      "step": 7558
+    },
+    {
+      "epoch": 0.9786063371848399,
+      "grad_norm": 2.386537577649605,
+      "learning_rate": 1.7370879214462232e-09,
+      "loss": 2.3914,
+      "step": 7559
+    },
+    {
+      "epoch": 0.9787357995921934,
+      "grad_norm": 1.4211663268329082,
+      "learning_rate": 1.7161057269138303e-09,
+      "loss": 2.387,
+      "step": 7560
+    },
+    {
+      "epoch": 0.9787357995921934,
+      "eval_PRM Accuracy": 0.2358490566037736,
+      "eval_PRM F1": 0.047058823529411764,
+      "eval_PRM F1 AUC": 0.5120481927710844,
+      "eval_PRM F1 Neg": 0.36220472440944884,
+      "eval_PRM NPV": 0.22115384615384615,
+      "eval_PRM Precision": 1.0,
+      "eval_PRM Recall": 0.024096385542168676,
+      "eval_PRM Specificty": 1.0,
+      "eval_loss": 1.494384765625,
+      "eval_runtime": 14.0268,
+      "eval_samples_per_second": 3.137,
+      "eval_steps_per_second": 0.214,
+      "step": 7560
+    },
+    {
+      "epoch": 0.9788652619995469,
+      "grad_norm": 2.1706050298282404,
+      "learning_rate": 1.6952508507501324e-09,
+      "loss": 2.1416,
+      "step": 7561
+    },
+    {
+      "epoch": 0.9789947244069004,
+      "grad_norm": 1.4697119638840281,
+      "learning_rate": 1.6745232972152637e-09,
+      "loss": 2.3052,
+      "step": 7562
+    },
+    {
+      "epoch": 0.9791241868142538,
+      "grad_norm": 1.9887583015605543,
+      "learning_rate": 1.6539230705432675e-09,
+      "loss": 2.7405,
+      "step": 7563
+    },
+    {
+      "epoch": 0.9792536492216073,
+      "grad_norm": 1.3002785682904727,
+      "learning_rate": 1.6334501749421667e-09,
+      "loss": 2.3696,
+      "step": 7564
+    },
+    {
+      "epoch": 0.9793831116289607,
+      "grad_norm": 4.01701817403821,
+      "learning_rate": 1.613104614593894e-09,
+      "loss": 2.3389,
+      "step": 7565
+    },
+    {
+      "epoch": 0.9793831116289607,
+      "eval_PRM Accuracy": 0.2358490566037736,
+      "eval_PRM F1": 0.047058823529411764,
+      "eval_PRM F1 AUC": 0.5120481927710844,
+      "eval_PRM F1 Neg": 0.36220472440944884,
+      "eval_PRM NPV": 0.22115384615384615,
+      "eval_PRM Precision": 1.0,
+      "eval_PRM Recall": 0.024096385542168676,
+      "eval_PRM Specificty": 1.0,
+      "eval_loss": 1.498579502105713,
+      "eval_runtime": 15.3295,
+      "eval_samples_per_second": 2.87,
+      "eval_steps_per_second": 0.196,
+      "step": 7565
+    },
+    {
+      "epoch": 0.9795125740363142,
+      "grad_norm": 2.82389856272306,
+      "learning_rate": 1.5928863936544998e-09,
+      "loss": 2.4026,
+      "step": 7566
+    },
+    {
+      "epoch": 0.9796420364436677,
+      "grad_norm": 1.9015822937119669,
+      "learning_rate": 1.5727955162539444e-09,
+      "loss": 2.387,
+      "step": 7567
+    },
+    {
+      "epoch": 0.9797714988510211,
+      "grad_norm": 1.1406419283583769,
+      "learning_rate": 1.5528319864961672e-09,
+      "loss": 2.1597,
+      "step": 7568
+    },
+    {
+      "epoch": 0.9799009612583746,
+      "grad_norm": 2.1355981721634114,
+      "learning_rate": 1.5329958084592255e-09,
+      "loss": 2.3271,
+      "step": 7569
+    },
+    {
+      "epoch": 0.980030423665728,
+      "grad_norm": 1.4628505282297621,
+      "learning_rate": 1.5132869861948785e-09,
+      "loss": 2.4343,
+      "step": 7570
+    },
+    {
+      "epoch": 0.980030423665728,
+      "eval_PRM Accuracy": 0.2358490566037736,
+      "eval_PRM F1": 0.047058823529411764,
+      "eval_PRM F1 AUC": 0.5120481927710844,
+      "eval_PRM F1 Neg": 0.36220472440944884,
+      "eval_PRM NPV": 0.22115384615384615,
+      "eval_PRM Precision": 1.0,
+      "eval_PRM Recall": 0.024096385542168676,
+      "eval_PRM Specificty": 1.0,
+      "eval_loss": 1.4957829713821411,
+      "eval_runtime": 13.8423,
+      "eval_samples_per_second": 3.179,
+      "eval_steps_per_second": 0.217,
+      "step": 7570
+    },
+    {
+      "epoch": 0.9801598860730816,
+      "grad_norm": 1.5826016277513821,
+      "learning_rate": 1.4937055237292802e-09,
+      "loss": 2.3635,
+      "step": 7571
+    },
+    {
+      "epoch": 0.980289348480435,
+      "grad_norm": 1.2967653618589454,
+      "learning_rate": 1.4742514250621481e-09,
+      "loss": 2.2004,
+      "step": 7572
+    },
+    {
+      "epoch": 0.9804188108877885,
+      "grad_norm": 1.348762418289272,
+      "learning_rate": 1.454924694167456e-09,
+      "loss": 2.439,
+      "step": 7573
+    },
+    {
+      "epoch": 0.9805482732951419,
+      "grad_norm": 2.0059993316066187,
+      "learning_rate": 1.4357253349931571e-09,
+      "loss": 2.3491,
+      "step": 7574
+    },
+    {
+      "epoch": 0.9806777357024954,
+      "grad_norm": 1.0696062980009842,
+      "learning_rate": 1.4166533514609754e-09,
+      "loss": 2.189,
+      "step": 7575
+    },
+    {
+      "epoch": 0.9806777357024954,
+      "eval_PRM Accuracy": 0.2358490566037736,
+      "eval_PRM F1": 0.047058823529411764,
+      "eval_PRM F1 AUC": 0.5120481927710844,
+      "eval_PRM F1 Neg": 0.36220472440944884,
+      "eval_PRM NPV": 0.22115384615384615,
+      "eval_PRM Precision": 1.0,
+      "eval_PRM Recall": 0.024096385542168676,
+      "eval_PRM Specificty": 1.0,
+      "eval_loss": 1.4971369504928589,
+      "eval_runtime": 14.5855,
+      "eval_samples_per_second": 3.017,
+      "eval_steps_per_second": 0.206,
+      "step": 7575
+    },
+    {
+      "epoch": 0.9808071981098488,
+      "grad_norm": 1.0643332651729815,
+      "learning_rate": 1.3977087474667527e-09,
+      "loss": 2.2942,
+      "step": 7576
+    },
+    {
+      "epoch": 0.9809366605172023,
+      "grad_norm": 1.3466758091724915,
+      "learning_rate": 1.3788915268804492e-09,
+      "loss": 2.3136,
+      "step": 7577
+    },
+    {
+      "epoch": 0.9810661229245558,
+      "grad_norm": 2.204496975992815,
+      "learning_rate": 1.3602016935457262e-09,
+      "loss": 2.4861,
+      "step": 7578
+    },
+    {
+      "epoch": 0.9811955853319092,
+      "grad_norm": 1.414782482719819,
+      "learning_rate": 1.3416392512804327e-09,
+      "loss": 2.283,
+      "step": 7579
+    },
+    {
+      "epoch": 0.9813250477392627,
+      "grad_norm": 2.985776601234628,
+      "learning_rate": 1.3232042038762577e-09,
+      "loss": 2.5293,
+      "step": 7580
+    },
+    {
+      "epoch": 0.9813250477392627,
+      "eval_PRM Accuracy": 0.2358490566037736,
+      "eval_PRM F1": 0.047058823529411764,
+      "eval_PRM F1 AUC": 0.5120481927710844,
+      "eval_PRM F1 Neg": 0.36220472440944884,
+      "eval_PRM NPV": 0.22115384615384615,
+      "eval_PRM Precision": 1.0,
+      "eval_PRM Recall": 0.024096385542168676,
+      "eval_PRM Specificty": 1.0,
+      "eval_loss": 1.4950283765792847,
+      "eval_runtime": 14.9875,
+      "eval_samples_per_second": 2.936,
+      "eval_steps_per_second": 0.2,
+      "step": 7580
+    },
+    {
+      "epoch": 0.9814545101466162,
+      "grad_norm": 2.130158472795342,
+      "learning_rate": 1.3048965550990083e-09,
+      "loss": 2.3813,
+      "step": 7581
+    },
+    {
+      "epoch": 0.9815839725539697,
+      "grad_norm": 1.623329970728458,
+      "learning_rate": 1.2867163086884015e-09,
+      "loss": 2.3645,
+      "step": 7582
+    },
+    {
+      "epoch": 0.9817134349613231,
+      "grad_norm": 1.9459265474325154,
+      "learning_rate": 1.268663468358064e-09,
+      "loss": 2.3744,
+      "step": 7583
+    },
+    {
+      "epoch": 0.9818428973686766,
+      "grad_norm": 2.1195756554460385,
+      "learning_rate": 1.2507380377956012e-09,
+      "loss": 2.4797,
+      "step": 7584
+    },
+    {
+      "epoch": 0.98197235977603,
+      "grad_norm": 1.7386627470623568,
+      "learning_rate": 1.2329400206628068e-09,
+      "loss": 2.4109,
+      "step": 7585
+    },
+    {
+      "epoch": 0.98197235977603,
+      "eval_PRM Accuracy": 0.2358490566037736,
+      "eval_PRM F1": 0.047058823529411764,
+      "eval_PRM F1 AUC": 0.5120481927710844,
+      "eval_PRM F1 Neg": 0.36220472440944884,
+      "eval_PRM NPV": 0.22115384615384615,
+      "eval_PRM Precision": 1.0,
+      "eval_PRM Recall": 0.024096385542168676,
+      "eval_PRM Specificty": 1.0,
+      "eval_loss": 1.4935635328292847,
+      "eval_runtime": 13.6963,
+      "eval_samples_per_second": 3.213,
+      "eval_steps_per_second": 0.219,
+      "step": 7585
+    },
+    {
+      "epoch": 0.9821018221833835,
+      "grad_norm": 1.1887944261227992,
+      "learning_rate": 1.2152694205951054e-09,
+      "loss": 2.2488,
+      "step": 7586
+    },
+    {
+      "epoch": 0.9822312845907369,
+      "grad_norm": 2.586722476127736,
+      "learning_rate": 1.1977262412022489e-09,
+      "loss": 2.4194,
+      "step": 7587
+    },
+    {
+      "epoch": 0.9823607469980904,
+      "grad_norm": 2.4786217471919127,
+      "learning_rate": 1.18031048606769e-09,
+      "loss": 2.8074,
+      "step": 7588
+    },
+    {
+      "epoch": 0.9824902094054438,
+      "grad_norm": 3.7031030228112605,
+      "learning_rate": 1.1630221587489304e-09,
+      "loss": 2.2295,
+      "step": 7589
+    },
+    {
+      "epoch": 0.9826196718127974,
+      "grad_norm": 2.26698201879527,
+      "learning_rate": 1.1458612627775201e-09,
+      "loss": 2.2422,
+      "step": 7590
+    },
+    {
+      "epoch": 0.9826196718127974,
+      "eval_PRM Accuracy": 0.2358490566037736,
+      "eval_PRM F1": 0.047058823529411764,
+      "eval_PRM F1 AUC": 0.5120481927710844,
+      "eval_PRM F1 Neg": 0.36220472440944884,
+      "eval_PRM NPV": 0.22115384615384615,
+      "eval_PRM Precision": 1.0,
+      "eval_PRM Recall": 0.024096385542168676,
+      "eval_PRM Specificty": 1.0,
+      "eval_loss": 1.4950283765792847,
+      "eval_runtime": 14.7278,
+      "eval_samples_per_second": 2.988,
+      "eval_steps_per_second": 0.204,
+      "step": 7590
+    },
+    {
+      "epoch": 0.9827491342201509,
+      "grad_norm": 1.8635644563124136,
+      "learning_rate": 1.1288278016588493e-09,
+      "loss": 2.2876,
+      "step": 7591
+    },
+    {
+      "epoch": 0.9828785966275043,
+      "grad_norm": 3.6206585566509584,
+      "learning_rate": 1.1119217788724268e-09,
+      "loss": 2.5964,
+      "step": 7592
+    },
+    {
+      "epoch": 0.9830080590348578,
+      "grad_norm": 1.868015361402047,
+      "learning_rate": 1.095143197871601e-09,
+      "loss": 2.5551,
+      "step": 7593
+    },
+    {
+      "epoch": 0.9831375214422112,
+      "grad_norm": 1.266705226144988,
+      "learning_rate": 1.078492062083769e-09,
+      "loss": 2.3367,
+      "step": 7594
+    },
+    {
+      "epoch": 0.9832669838495647,
+      "grad_norm": 1.8780513790793911,
+      "learning_rate": 1.0619683749102384e-09,
+      "loss": 2.2266,
+      "step": 7595
+    },
+    {
+      "epoch": 0.9832669838495647,
+      "eval_PRM Accuracy": 0.2358490566037736,
+      "eval_PRM F1": 0.047058823529411764,
+      "eval_PRM F1 AUC": 0.5120481927710844,
+      "eval_PRM F1 Neg": 0.36220472440944884,
+      "eval_PRM NPV": 0.22115384615384615,
+      "eval_PRM Precision": 1.0,
+      "eval_PRM Recall": 0.024096385542168676,
+      "eval_PRM Specificty": 1.0,
+      "eval_loss": 1.4957386255264282,
+      "eval_runtime": 14.1659,
+      "eval_samples_per_second": 3.106,
+      "eval_steps_per_second": 0.212,
+      "step": 7595
+    },
+    {
+      "epoch": 0.9833964462569181,
+      "grad_norm": 2.314347414973597,
+      "learning_rate": 1.045572139726364e-09,
+      "loss": 2.3955,
+      "step": 7596
+    },
+    {
+      "epoch": 0.9835259086642716,
+      "grad_norm": 2.6351190170336465,
+      "learning_rate": 1.029303359881273e-09,
+      "loss": 2.2913,
+      "step": 7597
+    },
+    {
+      "epoch": 0.983655371071625,
+      "grad_norm": 1.7546872803255078,
+      "learning_rate": 1.0131620386983482e-09,
+      "loss": 2.4309,
+      "step": 7598
+    },
+    {
+      "epoch": 0.9837848334789785,
+      "grad_norm": 2.3215434065106426,
+      "learning_rate": 9.971481794746745e-10,
+      "loss": 2.1787,
+      "step": 7599
+    },
+    {
+      "epoch": 0.9839142958863321,
+      "grad_norm": 1.2198424416141735,
+      "learning_rate": 9.812617854814549e-10,
+      "loss": 2.3247,
+      "step": 7600
+    },
+    {
+      "epoch": 0.9839142958863321,
+      "eval_PRM Accuracy": 0.2358490566037736,
+      "eval_PRM F1": 0.047058823529411764,
+      "eval_PRM F1 AUC": 0.5120481927710844,
+      "eval_PRM F1 Neg": 0.36220472440944884,
+      "eval_PRM NPV": 0.22115384615384615,
+      "eval_PRM Precision": 1.0,
+      "eval_PRM Recall": 0.024096385542168676,
+      "eval_PRM Specificty": 1.0,
+      "eval_loss": 1.4950283765792847,
+      "eval_runtime": 14.5217,
+      "eval_samples_per_second": 3.03,
+      "eval_steps_per_second": 0.207,
+      "step": 7600
+    },
+    {
+      "epoch": 0.9840437582936855,
+      "grad_norm": 1.519794772751305,
+      "learning_rate": 9.655028599638017e-10,
+      "loss": 2.5454,
+      "step": 7601
+    },
+    {
+      "epoch": 0.984173220701039,
+      "grad_norm": 1.2600965157647652,
+      "learning_rate": 9.498714061408065e-10,
+      "loss": 2.21,
+      "step": 7602
+    },
+    {
+      "epoch": 0.9843026831083924,
+      "grad_norm": 2.838040649791305,
+      "learning_rate": 9.343674272054709e-10,
+      "loss": 2.4016,
+      "step": 7603
+    },
+    {
+      "epoch": 0.9844321455157459,
+      "grad_norm": 1.6408515614253465,
+      "learning_rate": 9.189909263248448e-10,
+      "loss": 2.3752,
+      "step": 7604
+    },
+    {
+      "epoch": 0.9845616079230993,
+      "grad_norm": 2.1381858784410843,
+      "learning_rate": 9.037419066398878e-10,
+      "loss": 2.5369,
+      "step": 7605
+    },
+    {
+      "epoch": 0.9845616079230993,
+      "eval_PRM Accuracy": 0.2358490566037736,
+      "eval_PRM F1": 0.047058823529411764,
+      "eval_PRM F1 AUC": 0.5120481927710844,
+      "eval_PRM F1 Neg": 0.36220472440944884,
+      "eval_PRM NPV": 0.22115384615384615,
+      "eval_PRM Precision": 1.0,
+      "eval_PRM Recall": 0.024096385542168676,
+      "eval_PRM Specificty": 1.0,
+      "eval_loss": 1.4979802370071411,
+      "eval_runtime": 13.3075,
+      "eval_samples_per_second": 3.306,
+      "eval_steps_per_second": 0.225,
+      "step": 7605
+    },
+    {
+      "epoch": 0.9846910703304528,
+      "grad_norm": 1.5820801596214173,
+      "learning_rate": 8.886203712654695e-10,
+      "loss": 2.5869,
+      "step": 7606
+    },
+    {
+      "epoch": 0.9848205327378062,
+      "grad_norm": 3.27107927874882,
+      "learning_rate": 8.736263232905079e-10,
+      "loss": 2.4082,
+      "step": 7607
+    },
+    {
+      "epoch": 0.9849499951451597,
+      "grad_norm": 1.6374668708983278,
+      "learning_rate": 8.587597657778307e-10,
+      "loss": 2.4065,
+      "step": 7608
+    },
+    {
+      "epoch": 0.9850794575525131,
+      "grad_norm": 1.727336438934298,
+      "learning_rate": 8.440207017641755e-10,
+      "loss": 2.5813,
+      "step": 7609
+    },
+    {
+      "epoch": 0.9852089199598667,
+      "grad_norm": 1.6646088684556826,
+      "learning_rate": 8.294091342604671e-10,
+      "loss": 2.4685,
+      "step": 7610
+    },
+    {
+      "epoch": 0.9852089199598667,
+      "eval_PRM Accuracy": 0.2358490566037736,
+      "eval_PRM F1": 0.047058823529411764,
+      "eval_PRM F1 AUC": 0.5120481927710844,
+      "eval_PRM F1 Neg": 0.36220472440944884,
+      "eval_PRM NPV": 0.22115384615384615,
+      "eval_PRM Precision": 1.0,
+      "eval_PRM Recall": 0.024096385542168676,
+      "eval_PRM Specificty": 1.0,
+      "eval_loss": 1.4964932203292847,
+      "eval_runtime": 14.4666,
+      "eval_samples_per_second": 3.041,
+      "eval_steps_per_second": 0.207,
+      "step": 7610
+    },
+    {
+      "epoch": 0.9853383823672202,
+      "grad_norm": 1.6183130409645539,
+      "learning_rate": 8.149250662512626e-10,
+      "loss": 2.2349,
+      "step": 7611
+    },
+    {
+      "epoch": 0.9854678447745736,
+      "grad_norm": 1.9724083536469152,
+      "learning_rate": 8.005685006952368e-10,
+      "loss": 2.4695,
+      "step": 7612
+    },
+    {
+      "epoch": 0.9855973071819271,
+      "grad_norm": 1.3922509704379329,
+      "learning_rate": 7.863394405251135e-10,
+      "loss": 2.374,
+      "step": 7613
+    },
+    {
+      "epoch": 0.9857267695892805,
+      "grad_norm": 2.1223017834335094,
+      "learning_rate": 7.722378886473176e-10,
+      "loss": 2.1777,
+      "step": 7614
+    },
+    {
+      "epoch": 0.985856231996634,
+      "grad_norm": 2.718200331729673,
+      "learning_rate": 7.582638479424614e-10,
+      "loss": 2.4619,
+      "step": 7615
+    },
+    {
+      "epoch": 0.985856231996634,
+      "eval_PRM Accuracy": 0.2358490566037736,
+      "eval_PRM F1": 0.047058823529411764,
+      "eval_PRM F1 AUC": 0.5120481927710844,
+      "eval_PRM F1 Neg": 0.36220472440944884,
+      "eval_PRM NPV": 0.22115384615384615,
+      "eval_PRM Precision": 1.0,
+      "eval_PRM Recall": 0.024096385542168676,
+      "eval_PRM Specificty": 1.0,
+      "eval_loss": 1.493607997894287,
+      "eval_runtime": 15.0409,
+      "eval_samples_per_second": 2.925,
+      "eval_steps_per_second": 0.199,
+      "step": 7615
+    },
+    {
+      "epoch": 0.9859856944039874,
+      "grad_norm": 1.8789229257617968,
+      "learning_rate": 7.444173212650673e-10,
+      "loss": 2.3359,
+      "step": 7616
+    },
+    {
+      "epoch": 0.9861151568113409,
+      "grad_norm": 2.58106500301192,
+      "learning_rate": 7.306983114434979e-10,
+      "loss": 2.5012,
+      "step": 7617
+    },
+    {
+      "epoch": 0.9862446192186943,
+      "grad_norm": 1.7565557791717235,
+      "learning_rate": 7.171068212801641e-10,
+      "loss": 2.3738,
+      "step": 7618
+    },
+    {
+      "epoch": 0.9863740816260478,
+      "grad_norm": 2.554639240543607,
+      "learning_rate": 7.036428535513867e-10,
+      "loss": 2.5596,
+      "step": 7619
+    },
+    {
+      "epoch": 0.9865035440334013,
+      "grad_norm": 2.2603757514179184,
+      "learning_rate": 6.903064110074659e-10,
+      "loss": 2.4717,
+      "step": 7620
+    },
+    {
+      "epoch": 0.9865035440334013,
+      "eval_PRM Accuracy": 0.2358490566037736,
+      "eval_PRM F1": 0.047058823529411764,
+      "eval_PRM F1 AUC": 0.5120481927710844,
+      "eval_PRM F1 Neg": 0.36220472440944884,
+      "eval_PRM NPV": 0.22115384615384615,
+      "eval_PRM Precision": 1.0,
+      "eval_PRM Recall": 0.024096385542168676,
+      "eval_PRM Specificty": 1.0,
+      "eval_loss": 1.4978693723678589,
+      "eval_runtime": 14.3112,
+      "eval_samples_per_second": 3.075,
+      "eval_steps_per_second": 0.21,
+      "step": 7620
+    },
+    {
+      "epoch": 0.9866330064407548,
+      "grad_norm": 1.848935015750131,
+      "learning_rate": 6.770974963726807e-10,
+      "loss": 2.4548,
+      "step": 7621
+    },
+    {
+      "epoch": 0.9867624688481083,
+      "grad_norm": 1.4956095265091809,
+      "learning_rate": 6.640161123451505e-10,
+      "loss": 2.1816,
+      "step": 7622
+    },
+    {
+      "epoch": 0.9868919312554617,
+      "grad_norm": 1.630094864183574,
+      "learning_rate": 6.510622615970436e-10,
+      "loss": 2.3577,
+      "step": 7623
+    },
+    {
+      "epoch": 0.9870213936628152,
+      "grad_norm": 3.1326216222556083,
+      "learning_rate": 6.382359467744375e-10,
+      "loss": 2.3452,
+      "step": 7624
+    },
+    {
+      "epoch": 0.9871508560701686,
+      "grad_norm": 2.2543400031695144,
+      "learning_rate": 6.255371704973895e-10,
+      "loss": 2.4229,
+      "step": 7625
+    },
+    {
+      "epoch": 0.9871508560701686,
+      "eval_PRM Accuracy": 0.2358490566037736,
+      "eval_PRM F1": 0.047058823529411764,
+      "eval_PRM F1 AUC": 0.5120481927710844,
+      "eval_PRM F1 Neg": 0.36220472440944884,
+      "eval_PRM NPV": 0.22115384615384615,
+      "eval_PRM Precision": 1.0,
+      "eval_PRM Recall": 0.024096385542168676,
+      "eval_PRM Specificty": 1.0,
+      "eval_loss": 1.4950283765792847,
+      "eval_runtime": 15.7043,
+      "eval_samples_per_second": 2.802,
+      "eval_steps_per_second": 0.191,
+      "step": 7625
+    },
+    {
+      "epoch": 0.9872803184775221,
+      "grad_norm": 1.4943666856649598,
+      "learning_rate": 6.129659353597967e-10,
+      "loss": 2.377,
+      "step": 7626
+    },
+    {
+      "epoch": 0.9874097808848755,
+      "grad_norm": 1.6970512279219263,
+      "learning_rate": 6.005222439297437e-10,
+      "loss": 2.458,
+      "step": 7627
+    },
+    {
+      "epoch": 0.987539243292229,
+      "grad_norm": 1.360629472544963,
+      "learning_rate": 5.882060987490168e-10,
+      "loss": 2.2747,
+      "step": 7628
+    },
+    {
+      "epoch": 0.9876687056995825,
+      "grad_norm": 1.947585735123565,
+      "learning_rate": 5.760175023334507e-10,
+      "loss": 2.4478,
+      "step": 7629
+    },
+    {
+      "epoch": 0.987798168106936,
+      "grad_norm": 1.506017763428392,
+      "learning_rate": 5.639564571727902e-10,
+      "loss": 2.4949,
+      "step": 7630
+    },
+    {
+      "epoch": 0.987798168106936,
+      "eval_PRM Accuracy": 0.2358490566037736,
+      "eval_PRM F1": 0.047058823529411764,
+      "eval_PRM F1 AUC": 0.5120481927710844,
+      "eval_PRM F1 Neg": 0.36220472440944884,
+      "eval_PRM NPV": 0.22115384615384615,
+      "eval_PRM Precision": 1.0,
+      "eval_PRM Recall": 0.024096385542168676,
+      "eval_PRM Specificty": 1.0,
+      "eval_loss": 1.4949840307235718,
+      "eval_runtime": 14.2747,
+      "eval_samples_per_second": 3.082,
+      "eval_steps_per_second": 0.21,
+      "step": 7630
+    },
+    {
+      "epoch": 0.9879276305142894,
+      "grad_norm": 2.42281583678435,
+      "learning_rate": 5.520229657307585e-10,
+      "loss": 2.3638,
+      "step": 7631
+    },
+    {
+      "epoch": 0.9880570929216429,
+      "grad_norm": 1.5200091251742374,
+      "learning_rate": 5.402170304449894e-10,
+      "loss": 2.3445,
+      "step": 7632
+    },
+    {
+      "epoch": 0.9881865553289964,
+      "grad_norm": 3.56315214653513,
+      "learning_rate": 5.285386537271647e-10,
+      "loss": 2.4712,
+      "step": 7633
+    },
+    {
+      "epoch": 0.9883160177363498,
+      "grad_norm": 1.4993946555982482,
+      "learning_rate": 5.169878379628069e-10,
+      "loss": 2.3345,
+      "step": 7634
+    },
+    {
+      "epoch": 0.9884454801437033,
+      "grad_norm": 1.3766723430853567,
+      "learning_rate": 5.055645855112784e-10,
+      "loss": 2.2922,
+      "step": 7635
+    },
+    {
+      "epoch": 0.9884454801437033,
+      "eval_PRM Accuracy": 0.2358490566037736,
+      "eval_PRM F1": 0.047058823529411764,
+      "eval_PRM F1 AUC": 0.5120481927710844,
+      "eval_PRM F1 Neg": 0.36220472440944884,
+      "eval_PRM NPV": 0.22115384615384615,
+      "eval_PRM Precision": 1.0,
+      "eval_PRM Recall": 0.024096385542168676,
+      "eval_PRM Specificty": 1.0,
+      "eval_loss": 1.4942737817764282,
+      "eval_runtime": 13.9902,
+      "eval_samples_per_second": 3.145,
+      "eval_steps_per_second": 0.214,
+      "step": 7635
+    },
+    {
+      "epoch": 0.9885749425510567,
+      "grad_norm": 2.765105962883385,
+      "learning_rate": 4.942688987061989e-10,
+      "loss": 2.948,
+      "step": 7636
+    },
+    {
+      "epoch": 0.9887044049584102,
+      "grad_norm": 1.7884727220792906,
+      "learning_rate": 4.831007798548199e-10,
+      "loss": 2.4609,
+      "step": 7637
+    },
+    {
+      "epoch": 0.9888338673657636,
+      "grad_norm": 2.585771279521546,
+      "learning_rate": 4.720602312385109e-10,
+      "loss": 2.498,
+      "step": 7638
+    },
+    {
+      "epoch": 0.9889633297731172,
+      "grad_norm": 1.6577037565047226,
+      "learning_rate": 4.611472551124818e-10,
+      "loss": 2.323,
+      "step": 7639
+    },
+    {
+      "epoch": 0.9890927921804706,
+      "grad_norm": 2.742440349149222,
+      "learning_rate": 4.5036185370592176e-10,
+      "loss": 2.7051,
+      "step": 7640
+    },
+    {
+      "epoch": 0.9890927921804706,
+      "eval_PRM Accuracy": 0.2358490566037736,
+      "eval_PRM F1": 0.047058823529411764,
+      "eval_PRM F1 AUC": 0.5120481927710844,
+      "eval_PRM F1 Neg": 0.36220472440944884,
+      "eval_PRM NPV": 0.22115384615384615,
+      "eval_PRM Precision": 1.0,
+      "eval_PRM Recall": 0.024096385542168676,
+      "eval_PRM Specificty": 1.0,
+      "eval_loss": 1.4964932203292847,
+      "eval_runtime": 14.2938,
+      "eval_samples_per_second": 3.078,
+      "eval_steps_per_second": 0.21,
+      "step": 7640
+    },
+    {
+      "epoch": 0.9892222545878241,
+      "grad_norm": 1.899570315318355,
+      "learning_rate": 4.3970402922199895e-10,
+      "loss": 2.3279,
+      "step": 7641
+    },
+    {
+      "epoch": 0.9893517169951775,
+      "grad_norm": 1.429668343151256,
+      "learning_rate": 4.291737838378607e-10,
+      "loss": 2.2539,
+      "step": 7642
+    },
+    {
+      "epoch": 0.989481179402531,
+      "grad_norm": 1.666726346466479,
+      "learning_rate": 4.187711197043559e-10,
+      "loss": 2.2537,
+      "step": 7643
+    },
+    {
+      "epoch": 0.9896106418098845,
+      "grad_norm": 1.7583614698230214,
+      "learning_rate": 4.0849603894659027e-10,
+      "loss": 2.3398,
+      "step": 7644
+    },
+    {
+      "epoch": 0.9897401042172379,
+      "grad_norm": 1.218907723659834,
+      "learning_rate": 3.9834854366344044e-10,
+      "loss": 2.1571,
+      "step": 7645
+    },
+    {
+      "epoch": 0.9897401042172379,
+      "eval_PRM Accuracy": 0.2358490566037736,
+      "eval_PRM F1": 0.047058823529411764,
+      "eval_PRM F1 AUC": 0.5120481927710844,
+      "eval_PRM F1 Neg": 0.36220472440944884,
+      "eval_PRM NPV": 0.22115384615384615,
+      "eval_PRM Precision": 1.0,
+      "eval_PRM Recall": 0.024096385542168676,
+      "eval_PRM Specificty": 1.0,
+      "eval_loss": 1.4964932203292847,
+      "eval_runtime": 13.6451,
+      "eval_samples_per_second": 3.225,
+      "eval_steps_per_second": 0.22,
+      "step": 7645
+    },
+    {
+      "epoch": 0.9898695666245914,
+      "grad_norm": 2.16683363153041,
+      "learning_rate": 3.8832863592762336e-10,
+      "loss": 2.4543,
+      "step": 7646
+    },
+    {
+      "epoch": 0.9899990290319448,
+      "grad_norm": 1.8880776975893787,
+      "learning_rate": 3.7843631778604337e-10,
+      "loss": 2.314,
+      "step": 7647
+    },
+    {
+      "epoch": 0.9901284914392983,
+      "grad_norm": 1.913928145061539,
+      "learning_rate": 3.686715912593064e-10,
+      "loss": 2.385,
+      "step": 7648
+    },
+    {
+      "epoch": 0.9902579538466518,
+      "grad_norm": 2.598615507596037,
+      "learning_rate": 3.5903445834213625e-10,
+      "loss": 2.4478,
+      "step": 7649
+    },
+    {
+      "epoch": 0.9903874162540053,
+      "grad_norm": 2.781411612118827,
+      "learning_rate": 3.4952492100302773e-10,
+      "loss": 2.5112,
+      "step": 7650
+    },
+    {
+      "epoch": 0.9903874162540053,
+      "eval_PRM Accuracy": 0.2358490566037736,
+      "eval_PRM F1": 0.047058823529411764,
+      "eval_PRM F1 AUC": 0.5120481927710844,
+      "eval_PRM F1 Neg": 0.36220472440944884,
+      "eval_PRM NPV": 0.22115384615384615,
+      "eval_PRM Precision": 1.0,
+      "eval_PRM Recall": 0.024096385542168676,
+      "eval_PRM Specificty": 1.0,
+      "eval_loss": 1.4964488744735718,
+      "eval_runtime": 14.049,
+      "eval_samples_per_second": 3.132,
+      "eval_steps_per_second": 0.214,
+      "step": 7650
+    },
+    {
+      "epoch": 0.9905168786613587,
+      "grad_norm": 4.920852837984811,
+      "learning_rate": 3.4014298118452415e-10,
+      "loss": 2.8179,
+      "step": 7651
+    },
+    {
+      "epoch": 0.9906463410687122,
+      "grad_norm": 1.602683531452493,
+      "learning_rate": 3.308886408031481e-10,
+      "loss": 2.4128,
+      "step": 7652
+    },
+    {
+      "epoch": 0.9907758034760656,
+      "grad_norm": 2.1060923661609112,
+      "learning_rate": 3.217619017492624e-10,
+      "loss": 2.374,
+      "step": 7653
+    },
+    {
+      "epoch": 0.9909052658834191,
+      "grad_norm": 1.6204569374519608,
+      "learning_rate": 3.127627658870702e-10,
+      "loss": 2.3461,
+      "step": 7654
+    },
+    {
+      "epoch": 0.9910347282907725,
+      "grad_norm": 1.1008634986922998,
+      "learning_rate": 3.038912350549622e-10,
+      "loss": 2.2966,
+      "step": 7655
+    },
+    {
+      "epoch": 0.9910347282907725,
+      "eval_PRM Accuracy": 0.2358490566037736,
+      "eval_PRM F1": 0.047058823529411764,
+      "eval_PRM F1 AUC": 0.5120481927710844,
+      "eval_PRM F1 Neg": 0.36220472440944884,
+      "eval_PRM NPV": 0.22115384615384615,
+      "eval_PRM Precision": 1.0,
+      "eval_PRM Recall": 0.024096385542168676,
+      "eval_PRM Specificty": 1.0,
+      "eval_loss": 1.4950505495071411,
+      "eval_runtime": 13.6045,
+      "eval_samples_per_second": 3.234,
+      "eval_steps_per_second": 0.221,
+      "step": 7655
+    },
+    {
+      "epoch": 0.991164190698126,
+      "grad_norm": 2.1093204697180243,
+      "learning_rate": 2.9514731106509985e-10,
+      "loss": 2.3687,
+      "step": 7656
+    },
+    {
+      "epoch": 0.9912936531054795,
+      "grad_norm": 1.9171259210801308,
+      "learning_rate": 2.8653099570355447e-10,
+      "loss": 2.4336,
+      "step": 7657
+    },
+    {
+      "epoch": 0.9914231155128329,
+      "grad_norm": 2.3993710563557116,
+      "learning_rate": 2.7804229073044584e-10,
+      "loss": 2.3958,
+      "step": 7658
+    },
+    {
+      "epoch": 0.9915525779201865,
+      "grad_norm": 1.2834745849996845,
+      "learning_rate": 2.696811978797342e-10,
+      "loss": 2.4238,
+      "step": 7659
+    },
+    {
+      "epoch": 0.9916820403275399,
+      "grad_norm": 2.040530792128796,
+      "learning_rate": 2.614477188593589e-10,
+      "loss": 2.2217,
+      "step": 7660
+    },
+    {
+      "epoch": 0.9916820403275399,
+      "eval_PRM Accuracy": 0.2358490566037736,
+      "eval_PRM F1": 0.047058823529411764,
+      "eval_PRM F1 AUC": 0.5120481927710844,
+      "eval_PRM F1 Neg": 0.36220472440944884,
+      "eval_PRM NPV": 0.22115384615384615,
+      "eval_PRM Precision": 1.0,
+      "eval_PRM Recall": 0.024096385542168676,
+      "eval_PRM Specificty": 1.0,
+      "eval_loss": 1.498579502105713,
+      "eval_runtime": 13.8118,
+      "eval_samples_per_second": 3.186,
+      "eval_steps_per_second": 0.217,
+      "step": 7660
+    },
+    {
+      "epoch": 0.9918115027348934,
+      "grad_norm": 1.146395381273546,
+      "learning_rate": 2.5334185535109967e-10,
+      "loss": 2.1646,
+      "step": 7661
+    },
+    {
+      "epoch": 0.9919409651422468,
+      "grad_norm": 1.1207392650082522,
+      "learning_rate": 2.453636090108541e-10,
+      "loss": 2.3267,
+      "step": 7662
+    },
+    {
+      "epoch": 0.9920704275496003,
+      "grad_norm": 1.749398980875084,
+      "learning_rate": 2.375129814682908e-10,
+      "loss": 2.3125,
+      "step": 7663
+    },
+    {
+      "epoch": 0.9921998899569537,
+      "grad_norm": 1.4514255061424015,
+      "learning_rate": 2.2978997432705764e-10,
+      "loss": 2.2827,
+      "step": 7664
+    },
+    {
+      "epoch": 0.9923293523643072,
+      "grad_norm": 1.3744947085311505,
+      "learning_rate": 2.2219458916471205e-10,
+      "loss": 2.1985,
+      "step": 7665
+    },
+    {
+      "epoch": 0.9923293523643072,
+      "eval_PRM Accuracy": 0.2358490566037736,
+      "eval_PRM F1": 0.047058823529411764,
+      "eval_PRM F1 AUC": 0.5120481927710844,
+      "eval_PRM F1 Neg": 0.36220472440944884,
+      "eval_PRM NPV": 0.22115384615384615,
+      "eval_PRM Precision": 1.0,
+      "eval_PRM Recall": 0.024096385542168676,
+      "eval_PRM Specificty": 1.0,
+      "eval_loss": 1.4971369504928589,
+      "eval_runtime": 13.8034,
+      "eval_samples_per_second": 3.188,
+      "eval_steps_per_second": 0.217,
+      "step": 7665
+    },
+    {
+      "epoch": 0.9924588147716606,
+      "grad_norm": 1.9129455404788904,
+      "learning_rate": 2.1472682753279073e-10,
+      "loss": 2.4282,
+      "step": 7666
+    },
+    {
+      "epoch": 0.9925882771790141,
+      "grad_norm": 1.6119870892933774,
+      "learning_rate": 2.0738669095680952e-10,
+      "loss": 2.4197,
+      "step": 7667
+    },
+    {
+      "epoch": 0.9927177395863676,
+      "grad_norm": 2.025417941338564,
+      "learning_rate": 2.0017418093598583e-10,
+      "loss": 2.5481,
+      "step": 7668
+    },
+    {
+      "epoch": 0.9928472019937211,
+      "grad_norm": 1.7189407225275821,
+      "learning_rate": 1.9308929894372441e-10,
+      "loss": 2.249,
+      "step": 7669
+    },
+    {
+      "epoch": 0.9929766644010746,
+      "grad_norm": 2.6274370671024756,
+      "learning_rate": 1.8613204642720096e-10,
+      "loss": 2.5369,
+      "step": 7670
+    },
+    {
+      "epoch": 0.9929766644010746,
+      "eval_PRM Accuracy": 0.2358490566037736,
+      "eval_PRM F1": 0.047058823529411764,
+      "eval_PRM F1 AUC": 0.5120481927710844,
+      "eval_PRM F1 Neg": 0.36220472440944884,
+      "eval_PRM NPV": 0.22115384615384615,
+      "eval_PRM Precision": 1.0,
+      "eval_PRM Recall": 0.024096385542168676,
+      "eval_PRM Specificty": 1.0,
+      "eval_loss": 1.4986461400985718,
+      "eval_runtime": 14.0005,
+      "eval_samples_per_second": 3.143,
+      "eval_steps_per_second": 0.214,
+      "step": 7670
+    },
+    {
+      "epoch": 0.993106126808428,
+      "grad_norm": 1.733854755515088,
+      "learning_rate": 1.793024248076397e-10,
+      "loss": 2.4133,
+      "step": 7671
+    },
+    {
+      "epoch": 0.9932355892157815,
+      "grad_norm": 3.5557057390425304,
+      "learning_rate": 1.726004354801053e-10,
+      "loss": 2.5322,
+      "step": 7672
+    },
+    {
+      "epoch": 0.9933650516231349,
+      "grad_norm": 2.5351565687700592,
+      "learning_rate": 1.660260798136415e-10,
+      "loss": 2.5747,
+      "step": 7673
+    },
+    {
+      "epoch": 0.9934945140304884,
+      "grad_norm": 2.155793966215189,
+      "learning_rate": 1.5957935915113242e-10,
+      "loss": 2.3379,
+      "step": 7674
+    },
+    {
+      "epoch": 0.9936239764378418,
+      "grad_norm": 2.561628615143274,
+      "learning_rate": 1.532602748094414e-10,
+      "loss": 2.3025,
+      "step": 7675
+    },
+    {
+      "epoch": 0.9936239764378418,
+      "eval_PRM Accuracy": 0.2358490566037736,
+      "eval_PRM F1": 0.047058823529411764,
+      "eval_PRM F1 AUC": 0.5120481927710844,
+      "eval_PRM F1 Neg": 0.36220472440944884,
+      "eval_PRM NPV": 0.22115384615384615,
+      "eval_PRM Precision": 1.0,
+      "eval_PRM Recall": 0.024096385542168676,
+      "eval_PRM Specificty": 1.0,
+      "eval_loss": 1.4943625926971436,
+      "eval_runtime": 14.2777,
+      "eval_samples_per_second": 3.082,
+      "eval_steps_per_second": 0.21,
+      "step": 7675
+    },
+    {
+      "epoch": 0.9937534388451953,
+      "grad_norm": 1.4586702756577856,
+      "learning_rate": 1.470688280794108e-10,
+      "loss": 2.4033,
+      "step": 7676
+    },
+    {
+      "epoch": 0.9938829012525487,
+      "grad_norm": 1.7218032271015382,
+      "learning_rate": 1.410050202257929e-10,
+      "loss": 2.3477,
+      "step": 7677
+    },
+    {
+      "epoch": 0.9940123636599023,
+      "grad_norm": 2.066099568411916,
+      "learning_rate": 1.3506885248718016e-10,
+      "loss": 2.2959,
+      "step": 7678
+    },
+    {
+      "epoch": 0.9941418260672558,
+      "grad_norm": 2.098283026570332,
+      "learning_rate": 1.2926032607621375e-10,
+      "loss": 2.5974,
+      "step": 7679
+    },
+    {
+      "epoch": 0.9942712884746092,
+      "grad_norm": 1.6535605307389196,
+      "learning_rate": 1.2357944217937513e-10,
+      "loss": 2.1594,
+      "step": 7680
+    },
+    {
+      "epoch": 0.9942712884746092,
+      "eval_PRM Accuracy": 0.2358490566037736,
+      "eval_PRM F1": 0.047058823529411764,
+      "eval_PRM F1 AUC": 0.5120481927710844,
+      "eval_PRM F1 Neg": 0.36220472440944884,
+      "eval_PRM NPV": 0.22115384615384615,
+      "eval_PRM Precision": 1.0,
+      "eval_PRM Recall": 0.024096385542168676,
+      "eval_PRM Specificty": 1.0,
+      "eval_loss": 1.49853515625,
+      "eval_runtime": 13.6992,
+      "eval_samples_per_second": 3.212,
+      "eval_steps_per_second": 0.219,
+      "step": 7680
+    },
+    {
+      "epoch": 0.9944007508819627,
+      "grad_norm": 1.6459518108342641,
+      "learning_rate": 1.1802620195712487e-10,
+      "loss": 2.2615,
+      "step": 7681
+    },
+    {
+      "epoch": 0.9945302132893161,
+      "grad_norm": 2.1204057298785104,
+      "learning_rate": 1.1260060654376403e-10,
+      "loss": 2.3254,
+      "step": 7682
+    },
+    {
+      "epoch": 0.9946596756966696,
+      "grad_norm": 1.4357120737136115,
+      "learning_rate": 1.0730265704764208e-10,
+      "loss": 2.2004,
+      "step": 7683
+    },
+    {
+      "epoch": 0.994789138104023,
+      "grad_norm": 1.3728528906654596,
+      "learning_rate": 1.0213235455094895e-10,
+      "loss": 2.1951,
+      "step": 7684
+    },
+    {
+      "epoch": 0.9949186005113765,
+      "grad_norm": 3.21900535857529,
+      "learning_rate": 9.708970010978424e-11,
+      "loss": 2.3359,
+      "step": 7685
+    },
+    {
+      "epoch": 0.9949186005113765,
+      "eval_PRM Accuracy": 0.2358490566037736,
+      "eval_PRM F1": 0.047058823529411764,
+      "eval_PRM F1 AUC": 0.5120481927710844,
+      "eval_PRM F1 Neg": 0.36220472440944884,
+      "eval_PRM NPV": 0.22115384615384615,
+      "eval_PRM Precision": 1.0,
+      "eval_PRM Recall": 0.024096385542168676,
+      "eval_PRM Specificty": 1.0,
+      "eval_loss": 1.4950062036514282,
+      "eval_runtime": 14.3312,
+      "eval_samples_per_second": 3.07,
+      "eval_steps_per_second": 0.209,
+      "step": 7685
+    },
+    {
+      "epoch": 0.9950480629187299,
+      "grad_norm": 1.6686792950383713,
+      "learning_rate": 9.217469475429619e-11,
+      "loss": 2.2742,
+      "step": 7686
+    },
+    {
+      "epoch": 0.9951775253260834,
+      "grad_norm": 2.2413072500408857,
+      "learning_rate": 8.738733948840395e-11,
+      "loss": 2.1741,
+      "step": 7687
+    },
+    {
+      "epoch": 0.995306987733437,
+      "grad_norm": 2.9388080891161135,
+      "learning_rate": 8.272763529007521e-11,
+      "loss": 2.5015,
+      "step": 7688
+    },
+    {
+      "epoch": 0.9954364501407904,
+      "grad_norm": 1.2448282419855086,
+      "learning_rate": 7.819558311111808e-11,
+      "loss": 2.158,
+      "step": 7689
+    },
+    {
+      "epoch": 0.9955659125481439,
+      "grad_norm": 1.5770981587173023,
+      "learning_rate": 7.379118387731977e-11,
+      "loss": 2.605,
+      "step": 7690
+    },
+    {
+      "epoch": 0.9955659125481439,
+      "eval_PRM Accuracy": 0.2358490566037736,
+      "eval_PRM F1": 0.047058823529411764,
+      "eval_PRM F1 AUC": 0.5120481927710844,
+      "eval_PRM F1 Neg": 0.36220472440944884,
+      "eval_PRM NPV": 0.22115384615384615,
+      "eval_PRM Precision": 1.0,
+      "eval_PRM Recall": 0.024096385542168676,
+      "eval_PRM Specificty": 1.0,
+      "eval_loss": 1.4972034692764282,
+      "eval_runtime": 14.7955,
+      "eval_samples_per_second": 2.974,
+      "eval_steps_per_second": 0.203,
+      "step": 7690
+    },
+    {
+      "epoch": 0.9956953749554973,
+      "grad_norm": 2.2313159470985133,
+      "learning_rate": 6.951443848830785e-11,
+      "loss": 2.2695,
+      "step": 7691
+    },
+    {
+      "epoch": 0.9958248373628508,
+      "grad_norm": 1.583978575410211,
+      "learning_rate": 6.53653478177585e-11,
+      "loss": 2.5193,
+      "step": 7692
+    },
+    {
+      "epoch": 0.9959542997702042,
+      "grad_norm": 2.6329864704078796,
+      "learning_rate": 6.134391271318818e-11,
+      "loss": 2.1763,
+      "step": 7693
+    },
+    {
+      "epoch": 0.9960837621775577,
+      "grad_norm": 1.9048592700851108,
+      "learning_rate": 5.745013399609256e-11,
+      "loss": 2.2927,
+      "step": 7694
+    },
+    {
+      "epoch": 0.9962132245849111,
+      "grad_norm": 1.2076390899334741,
+      "learning_rate": 5.3684012461738265e-11,
+      "loss": 2.2676,
+      "step": 7695
+    },
+    {
+      "epoch": 0.9962132245849111,
+      "eval_PRM Accuracy": 0.2358490566037736,
+      "eval_PRM F1": 0.047058823529411764,
+      "eval_PRM F1 AUC": 0.5120481927710844,
+      "eval_PRM F1 Neg": 0.36220472440944884,
+      "eval_PRM NPV": 0.22115384615384615,
+      "eval_PRM Precision": 1.0,
+      "eval_PRM Recall": 0.024096385542168676,
+      "eval_PRM Specificty": 1.0,
+      "eval_loss": 1.4951171875,
+      "eval_runtime": 15.159,
+      "eval_samples_per_second": 2.903,
+      "eval_steps_per_second": 0.198,
+      "step": 7695
+    },
+    {
+      "epoch": 0.9963426869922646,
+      "grad_norm": 1.6253165998282486,
+      "learning_rate": 5.004554887957924e-11,
+      "loss": 2.2419,
+      "step": 7696
+    },
+    {
+      "epoch": 0.996472149399618,
+      "grad_norm": 2.151738149711087,
+      "learning_rate": 4.6534743992701635e-11,
+      "loss": 2.6377,
+      "step": 7697
+    },
+    {
+      "epoch": 0.9966016118069716,
+      "grad_norm": 1.9143121114234054,
+      "learning_rate": 4.315159851837891e-11,
+      "loss": 2.3135,
+      "step": 7698
+    },
+    {
+      "epoch": 0.996731074214325,
+      "grad_norm": 1.5023196597769006,
+      "learning_rate": 3.989611314765551e-11,
+      "loss": 2.3765,
+      "step": 7699
+    },
+    {
+      "epoch": 0.9968605366216785,
+      "grad_norm": 1.9325526285591823,
+      "learning_rate": 3.6768288545485644e-11,
+      "loss": 2.4561,
+      "step": 7700
+    },
+    {
+      "epoch": 0.9968605366216785,
+      "eval_PRM Accuracy": 0.2358490566037736,
+      "eval_PRM F1": 0.047058823529411764,
+      "eval_PRM F1 AUC": 0.5120481927710844,
+      "eval_PRM F1 Neg": 0.36220472440944884,
+      "eval_PRM NPV": 0.22115384615384615,
+      "eval_PRM Precision": 1.0,
+      "eval_PRM Recall": 0.024096385542168676,
+      "eval_PRM Specificty": 1.0,
+      "eval_loss": 1.4986239671707153,
+      "eval_runtime": 14.5617,
+      "eval_samples_per_second": 3.022,
+      "eval_steps_per_second": 0.206,
+      "step": 7700
+    },
+    {
+      "epoch": 0.996989999029032,
+      "grad_norm": 1.4172984725227213,
+      "learning_rate": 3.376812535080265e-11,
+      "loss": 2.373,
+      "step": 7701
+    },
+    {
+      "epoch": 0.9971194614363854,
+      "grad_norm": 1.3930326525241075,
+      "learning_rate": 3.0895624176519036e-11,
+      "loss": 2.3347,
+      "step": 7702
+    },
+    {
+      "epoch": 0.9972489238437389,
+      "grad_norm": 1.3253972058225258,
+      "learning_rate": 2.8150785609318276e-11,
+      "loss": 2.4019,
+      "step": 7703
+    },
+    {
+      "epoch": 0.9973783862510923,
+      "grad_norm": 1.5408348561147462,
+      "learning_rate": 2.5533610209932392e-11,
+      "loss": 2.3169,
+      "step": 7704
+    },
+    {
+      "epoch": 0.9975078486584458,
+      "grad_norm": 2.3013034684937415,
+      "learning_rate": 2.3044098512933766e-11,
+      "loss": 2.5208,
+      "step": 7705
+    },
+    {
+      "epoch": 0.9975078486584458,
+      "eval_PRM Accuracy": 0.2358490566037736,
+      "eval_PRM F1": 0.047058823529411764,
+      "eval_PRM F1 AUC": 0.5120481927710844,
+      "eval_PRM F1 Neg": 0.36220472440944884,
+      "eval_PRM NPV": 0.22115384615384615,
+      "eval_PRM Precision": 1.0,
+      "eval_PRM Recall": 0.024096385542168676,
+      "eval_PRM Specificty": 1.0,
+      "eval_loss": 1.4978249073028564,
+      "eval_runtime": 13.1607,
+      "eval_samples_per_second": 3.343,
+      "eval_steps_per_second": 0.228,
+      "step": 7705
+    },
+    {
+      "epoch": 0.9976373110657992,
+      "grad_norm": 2.259931800473903,
+      "learning_rate": 2.068225102694332e-11,
+      "loss": 2.1882,
+      "step": 7706
+    },
+    {
+      "epoch": 0.9977667734731527,
+      "grad_norm": 1.7890624569047229,
+      "learning_rate": 1.8448068234283578e-11,
+      "loss": 2.4595,
+      "step": 7707
+    },
+    {
+      "epoch": 0.9978962358805062,
+      "grad_norm": 1.2401958555293557,
+      "learning_rate": 1.634155059146436e-11,
+      "loss": 2.2754,
+      "step": 7708
+    },
+    {
+      "epoch": 0.9980256982878597,
+      "grad_norm": 1.0822891791340588,
+      "learning_rate": 1.4362698528697094e-11,
+      "loss": 2.4175,
+      "step": 7709
+    },
+    {
+      "epoch": 0.9981551606952132,
+      "grad_norm": 1.6127689542819217,
+      "learning_rate": 1.2511512450241737e-11,
+      "loss": 2.4133,
+      "step": 7710
+    },
+    {
+      "epoch": 0.9981551606952132,
+      "eval_PRM Accuracy": 0.2358490566037736,
+      "eval_PRM F1": 0.047058823529411764,
+      "eval_PRM F1 AUC": 0.5120481927710844,
+      "eval_PRM F1 Neg": 0.36220472440944884,
+      "eval_PRM NPV": 0.22115384615384615,
+      "eval_PRM Precision": 1.0,
+      "eval_PRM Recall": 0.024096385542168676,
+      "eval_PRM Specificty": 1.0,
+      "eval_loss": 1.497114658355713,
+      "eval_runtime": 14.9295,
+      "eval_samples_per_second": 2.947,
+      "eval_steps_per_second": 0.201,
+      "step": 7710
+    },
+    {
+      "epoch": 0.9982846231025666,
+      "grad_norm": 1.7945901352090199,
+      "learning_rate": 1.0787992734198616e-11,
+      "loss": 2.4961,
+      "step": 7711
+    },
+    {
+      "epoch": 0.9984140855099201,
+      "grad_norm": 1.3928437748878686,
+      "learning_rate": 9.192139732716598e-12,
+      "loss": 2.4438,
+      "step": 7712
+    },
+    {
+      "epoch": 0.9985435479172735,
+      "grad_norm": 2.9852499683419422,
+      "learning_rate": 7.723953771715531e-12,
+      "loss": 2.3274,
+      "step": 7713
+    },
+    {
+      "epoch": 0.998673010324627,
+      "grad_norm": 2.150419645821146,
+      "learning_rate": 6.383435151094408e-12,
+      "loss": 2.4382,
+      "step": 7714
+    },
+    {
+      "epoch": 0.9988024727319804,
+      "grad_norm": 1.657145315275181,
+      "learning_rate": 5.170584144661983e-12,
+      "loss": 2.5605,
+      "step": 7715
+    },
+    {
+      "epoch": 0.9988024727319804,
+      "eval_PRM Accuracy": 0.2358490566037736,
+      "eval_PRM F1": 0.047058823529411764,
+      "eval_PRM F1 AUC": 0.5120481927710844,
+      "eval_PRM F1 Neg": 0.36220472440944884,
+      "eval_PRM NPV": 0.22115384615384615,
+      "eval_PRM Precision": 1.0,
+      "eval_PRM Recall": 0.024096385542168676,
+      "eval_PRM Specificty": 1.0,
+      "eval_loss": 1.4971591234207153,
+      "eval_runtime": 15.0228,
+      "eval_samples_per_second": 2.929,
+      "eval_steps_per_second": 0.2,
+      "step": 7715
+    },
+    {
+      "epoch": 0.9989319351393339,
+      "grad_norm": 1.4614906798288771,
+      "learning_rate": 4.0854010002755466e-12,
+      "loss": 2.2092,
+      "step": 7716
+    },
+    {
+      "epoch": 0.9990613975466874,
+      "grad_norm": 2.668030707241662,
+      "learning_rate": 3.12788593949398e-12,
+      "loss": 2.4106,
+      "step": 7717
+    },
+    {
+      "epoch": 0.9991908599540409,
+      "grad_norm": 1.4888698890193617,
+      "learning_rate": 2.298039157994092e-12,
+      "loss": 2.3706,
+      "step": 7718
+    },
+    {
+      "epoch": 0.9993203223613943,
+      "grad_norm": 1.558004894188135,
+      "learning_rate": 1.5958608251542828e-12,
+      "loss": 2.3206,
+      "step": 7719
+    },
+    {
+      "epoch": 0.9994497847687478,
+      "grad_norm": 2.4306575905372134,
+      "learning_rate": 1.0213510846096564e-12,
+      "loss": 2.4265,
+      "step": 7720
+    },
+    {
+      "epoch": 0.9994497847687478,
+      "eval_PRM Accuracy": 0.2358490566037736,
+      "eval_PRM F1": 0.047058823529411764,
+      "eval_PRM F1 AUC": 0.5120481927710844,
+      "eval_PRM F1 Neg": 0.36220472440944884,
+      "eval_PRM NPV": 0.22115384615384615,
+      "eval_PRM Precision": 1.0,
+      "eval_PRM Recall": 0.024096385542168676,
+      "eval_PRM Specificty": 1.0,
+      "eval_loss": 1.4971591234207153,
+      "eval_runtime": 14.2046,
+      "eval_samples_per_second": 3.098,
+      "eval_steps_per_second": 0.211,
+      "step": 7720
+    },
+    {
+      "epoch": 0.9995792471761012,
+      "grad_norm": 2.458064036563779,
+      "learning_rate": 5.745100535581305e-13,
+      "loss": 2.3542,
+      "step": 7721
+    },
+    {
+      "epoch": 0.9997087095834547,
+      "grad_norm": 2.295762242918334,
+      "learning_rate": 2.5533782331554903e-13,
+      "loss": 2.5386,
+      "step": 7722
+    },
+    {
+      "epoch": 0.9998381719908082,
+      "grad_norm": 2.5005497572826556,
+      "learning_rate": 6.383445910751463e-14,
+      "loss": 2.3679,
+      "step": 7723
+    },
+    {
+      "epoch": 0.9999676343981616,
+      "grad_norm": 2.2599512852855326,
+      "learning_rate": 0.0,
+      "loss": 2.4456,
+      "step": 7724
     }
   ],
   "logging_steps": 1,
         "should_evaluate": false,
         "should_log": false,
         "should_save": true,
+        "should_training_stop": true
       },
       "attributes": {}
     }
   },
+  "total_flos": 6493605880496128.0,
   "train_batch_size": 4,
   "trial_name": null,
   "trial_params": null