add new ranker

Browse files

Files changed (11) hide show

ranker_9/checkpoint-800/config.json +29 -0
ranker_9/checkpoint-800/merges.txt +0 -0
ranker_9/checkpoint-800/optimizer.pt +3 -0
ranker_9/checkpoint-800/pytorch_model.bin +3 -0
ranker_9/checkpoint-800/rng_state.pth +3 -0
ranker_9/checkpoint-800/scheduler.pt +3 -0
ranker_9/checkpoint-800/special_tokens_map.json +9 -0
ranker_9/checkpoint-800/tokenizer_config.json +65 -0
ranker_9/checkpoint-800/trainer_state.json +1028 -0
ranker_9/checkpoint-800/training_args.bin +3 -0
ranker_9/checkpoint-800/vocab.json +0 -0

ranker_9/checkpoint-800/config.json ADDED Viewed

	@@ -0,0 +1,29 @@

+{
+  "_name_or_path": "microsoft/codebert-base",
+  "architectures": [
+    "RobertaForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "bos_token_id": 0,
+  "classifier_dropout": null,
+  "eos_token_id": 2,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "layer_norm_eps": 1e-05,
+  "max_position_embeddings": 514,
+  "model_type": "roberta",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "output_past": true,
+  "pad_token_id": 1,
+  "position_embedding_type": "absolute",
+  "problem_type": "single_label_classification",
+  "torch_dtype": "float32",
+  "transformers_version": "4.26.1",
+  "type_vocab_size": 1,
+  "use_cache": true,
+  "vocab_size": 50265
+}

ranker_9/checkpoint-800/merges.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

ranker_9/checkpoint-800/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d20e036566e07151f5ed16f3285b17c47dafa80858829435ebb02d8b2975a214
+size 997295237

ranker_9/checkpoint-800/pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a2cebe0eeefe4cd17f1335d6e91f0d05947c5157fe5f7dc54144f60d9233b535
+size 498662069

ranker_9/checkpoint-800/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:2c27c5a13788d5ab0de360c018031ecf890c18fd13458ae74fad3f4d6b504d94
+size 15597

ranker_9/checkpoint-800/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c6a5c3e1c781b3d6c9f9adade16b230e620ed9571282c67bc5ddf8474b3ff217
+size 627

ranker_9/checkpoint-800/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,9 @@

+{
+  "bos_token": "<s>",
+  "cls_token": "<s>",
+  "eos_token": "</s>",
+  "mask_token": "<mask>",
+  "pad_token": "<pad>",
+  "sep_token": "</s>",
+  "unk_token": "<unk>"
+}

ranker_9/checkpoint-800/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,65 @@

+{
+  "add_prefix_space": false,
+  "bos_token": {
+    "__type": "AddedToken",
+    "content": "<s>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  },
+  "cls_token": {
+    "__type": "AddedToken",
+    "content": "<s>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  },
+  "eos_token": {
+    "__type": "AddedToken",
+    "content": "</s>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  },
+  "errors": "replace",
+  "mask_token": {
+    "__type": "AddedToken",
+    "content": "<mask>",
+    "lstrip": true,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  },
+  "model_max_length": 512,
+  "name_or_path": "microsoft/codebert-base",
+  "pad_token": {
+    "__type": "AddedToken",
+    "content": "<pad>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  },
+  "sep_token": {
+    "__type": "AddedToken",
+    "content": "</s>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  },
+  "special_tokens_map_file": "/om2/user/gua/.cache/huggingface/hub/models--microsoft--codebert-base/snapshots/3b0952feddeffad0063f274080e3c23d75e7eb39/special_tokens_map.json",
+  "tokenizer_class": "RobertaTokenizer",
+  "unk_token": {
+    "__type": "AddedToken",
+    "content": "<unk>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  },
+  "use_fast": true
+}

ranker_9/checkpoint-800/trainer_state.json ADDED Viewed

	@@ -0,0 +1,1028 @@

+{
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 2.3323615160349855,
+  "global_step": 800,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.01,
+      "learning_rate": 1.9970845481049562e-05,
+      "loss": 0.7026,
+      "step": 5
+    },
+    {
+      "epoch": 0.03,
+      "learning_rate": 1.9941690962099126e-05,
+      "loss": 0.681,
+      "step": 10
+    },
+    {
+      "epoch": 0.04,
+      "learning_rate": 1.991253644314869e-05,
+      "loss": 0.6654,
+      "step": 15
+    },
+    {
+      "epoch": 0.06,
+      "learning_rate": 1.9883381924198253e-05,
+      "loss": 0.6638,
+      "step": 20
+    },
+    {
+      "epoch": 0.07,
+      "learning_rate": 1.9854227405247814e-05,
+      "loss": 0.6479,
+      "step": 25
+    },
+    {
+      "epoch": 0.09,
+      "learning_rate": 1.9825072886297377e-05,
+      "loss": 0.6243,
+      "step": 30
+    },
+    {
+      "epoch": 0.1,
+      "learning_rate": 1.979591836734694e-05,
+      "loss": 0.5941,
+      "step": 35
+    },
+    {
+      "epoch": 0.12,
+      "learning_rate": 1.9766763848396505e-05,
+      "loss": 0.5806,
+      "step": 40
+    },
+    {
+      "epoch": 0.13,
+      "learning_rate": 1.9737609329446065e-05,
+      "loss": 0.5747,
+      "step": 45
+    },
+    {
+      "epoch": 0.15,
+      "learning_rate": 1.970845481049563e-05,
+      "loss": 0.5485,
+      "step": 50
+    },
+    {
+      "epoch": 0.16,
+      "learning_rate": 1.9679300291545193e-05,
+      "loss": 0.5271,
+      "step": 55
+    },
+    {
+      "epoch": 0.17,
+      "learning_rate": 1.9650145772594753e-05,
+      "loss": 0.5541,
+      "step": 60
+    },
+    {
+      "epoch": 0.19,
+      "learning_rate": 1.9620991253644317e-05,
+      "loss": 0.5336,
+      "step": 65
+    },
+    {
+      "epoch": 0.2,
+      "learning_rate": 1.9591836734693877e-05,
+      "loss": 0.5274,
+      "step": 70
+    },
+    {
+      "epoch": 0.22,
+      "learning_rate": 1.956268221574344e-05,
+      "loss": 0.5194,
+      "step": 75
+    },
+    {
+      "epoch": 0.23,
+      "learning_rate": 1.9533527696793005e-05,
+      "loss": 0.4857,
+      "step": 80
+    },
+    {
+      "epoch": 0.25,
+      "learning_rate": 1.950437317784257e-05,
+      "loss": 0.498,
+      "step": 85
+    },
+    {
+      "epoch": 0.26,
+      "learning_rate": 1.947521865889213e-05,
+      "loss": 0.4707,
+      "step": 90
+    },
+    {
+      "epoch": 0.28,
+      "learning_rate": 1.9446064139941693e-05,
+      "loss": 0.4736,
+      "step": 95
+    },
+    {
+      "epoch": 0.29,
+      "learning_rate": 1.9416909620991257e-05,
+      "loss": 0.4997,
+      "step": 100
+    },
+    {
+      "epoch": 0.31,
+      "learning_rate": 1.9387755102040817e-05,
+      "loss": 0.4745,
+      "step": 105
+    },
+    {
+      "epoch": 0.32,
+      "learning_rate": 1.935860058309038e-05,
+      "loss": 0.4709,
+      "step": 110
+    },
+    {
+      "epoch": 0.34,
+      "learning_rate": 1.9329446064139944e-05,
+      "loss": 0.4663,
+      "step": 115
+    },
+    {
+      "epoch": 0.35,
+      "learning_rate": 1.9300291545189508e-05,
+      "loss": 0.4647,
+      "step": 120
+    },
+    {
+      "epoch": 0.36,
+      "learning_rate": 1.927113702623907e-05,
+      "loss": 0.4485,
+      "step": 125
+    },
+    {
+      "epoch": 0.38,
+      "learning_rate": 1.9241982507288632e-05,
+      "loss": 0.4528,
+      "step": 130
+    },
+    {
+      "epoch": 0.39,
+      "learning_rate": 1.9212827988338193e-05,
+      "loss": 0.4505,
+      "step": 135
+    },
+    {
+      "epoch": 0.41,
+      "learning_rate": 1.9183673469387756e-05,
+      "loss": 0.4499,
+      "step": 140
+    },
+    {
+      "epoch": 0.42,
+      "learning_rate": 1.915451895043732e-05,
+      "loss": 0.4496,
+      "step": 145
+    },
+    {
+      "epoch": 0.44,
+      "learning_rate": 1.912536443148688e-05,
+      "loss": 0.4808,
+      "step": 150
+    },
+    {
+      "epoch": 0.45,
+      "learning_rate": 1.9096209912536444e-05,
+      "loss": 0.4437,
+      "step": 155
+    },
+    {
+      "epoch": 0.47,
+      "learning_rate": 1.9067055393586008e-05,
+      "loss": 0.4519,
+      "step": 160
+    },
+    {
+      "epoch": 0.48,
+      "learning_rate": 1.9037900874635572e-05,
+      "loss": 0.4467,
+      "step": 165
+    },
+    {
+      "epoch": 0.5,
+      "learning_rate": 1.9008746355685132e-05,
+      "loss": 0.4314,
+      "step": 170
+    },
+    {
+      "epoch": 0.51,
+      "learning_rate": 1.8979591836734696e-05,
+      "loss": 0.4398,
+      "step": 175
+    },
+    {
+      "epoch": 0.52,
+      "learning_rate": 1.895043731778426e-05,
+      "loss": 0.4302,
+      "step": 180
+    },
+    {
+      "epoch": 0.54,
+      "learning_rate": 1.892128279883382e-05,
+      "loss": 0.4102,
+      "step": 185
+    },
+    {
+      "epoch": 0.55,
+      "learning_rate": 1.8892128279883384e-05,
+      "loss": 0.4152,
+      "step": 190
+    },
+    {
+      "epoch": 0.57,
+      "learning_rate": 1.8862973760932944e-05,
+      "loss": 0.4071,
+      "step": 195
+    },
+    {
+      "epoch": 0.58,
+      "learning_rate": 1.8833819241982508e-05,
+      "loss": 0.4138,
+      "step": 200
+    },
+    {
+      "epoch": 0.58,
+      "eval_accuracy": 0.7340279681930354,
+      "eval_accuracy_sklearn": 0.7340279681930354,
+      "eval_f1": 0.623921682659688,
+      "eval_loss": 0.5162232518196106,
+      "eval_precision": 0.6743138487324534,
+      "eval_recall": 0.5805375180375181,
+      "eval_runtime": 166.8611,
+      "eval_samples_per_second": 174.852,
+      "eval_steps_per_second": 10.931,
+      "step": 200
+    },
+    {
+      "epoch": 0.6,
+      "learning_rate": 1.8804664723032072e-05,
+      "loss": 0.3971,
+      "step": 205
+    },
+    {
+      "epoch": 0.61,
+      "learning_rate": 1.8775510204081636e-05,
+      "loss": 0.3886,
+      "step": 210
+    },
+    {
+      "epoch": 0.63,
+      "learning_rate": 1.8746355685131196e-05,
+      "loss": 0.4183,
+      "step": 215
+    },
+    {
+      "epoch": 0.64,
+      "learning_rate": 1.871720116618076e-05,
+      "loss": 0.4144,
+      "step": 220
+    },
+    {
+      "epoch": 0.66,
+      "learning_rate": 1.8688046647230323e-05,
+      "loss": 0.3996,
+      "step": 225
+    },
+    {
+      "epoch": 0.67,
+      "learning_rate": 1.8658892128279884e-05,
+      "loss": 0.3802,
+      "step": 230
+    },
+    {
+      "epoch": 0.69,
+      "learning_rate": 1.8629737609329448e-05,
+      "loss": 0.4201,
+      "step": 235
+    },
+    {
+      "epoch": 0.7,
+      "learning_rate": 1.8600583090379008e-05,
+      "loss": 0.3977,
+      "step": 240
+    },
+    {
+      "epoch": 0.71,
+      "learning_rate": 1.8571428571428575e-05,
+      "loss": 0.3927,
+      "step": 245
+    },
+    {
+      "epoch": 0.73,
+      "learning_rate": 1.8542274052478135e-05,
+      "loss": 0.387,
+      "step": 250
+    },
+    {
+      "epoch": 0.74,
+      "learning_rate": 1.85131195335277e-05,
+      "loss": 0.3892,
+      "step": 255
+    },
+    {
+      "epoch": 0.76,
+      "learning_rate": 1.848396501457726e-05,
+      "loss": 0.3728,
+      "step": 260
+    },
+    {
+      "epoch": 0.77,
+      "learning_rate": 1.8454810495626823e-05,
+      "loss": 0.3874,
+      "step": 265
+    },
+    {
+      "epoch": 0.79,
+      "learning_rate": 1.8425655976676387e-05,
+      "loss": 0.3806,
+      "step": 270
+    },
+    {
+      "epoch": 0.8,
+      "learning_rate": 1.8396501457725948e-05,
+      "loss": 0.3848,
+      "step": 275
+    },
+    {
+      "epoch": 0.82,
+      "learning_rate": 1.836734693877551e-05,
+      "loss": 0.3874,
+      "step": 280
+    },
+    {
+      "epoch": 0.83,
+      "learning_rate": 1.8338192419825075e-05,
+      "loss": 0.367,
+      "step": 285
+    },
+    {
+      "epoch": 0.85,
+      "learning_rate": 1.830903790087464e-05,
+      "loss": 0.3732,
+      "step": 290
+    },
+    {
+      "epoch": 0.86,
+      "learning_rate": 1.82798833819242e-05,
+      "loss": 0.3671,
+      "step": 295
+    },
+    {
+      "epoch": 0.87,
+      "learning_rate": 1.8250728862973763e-05,
+      "loss": 0.3776,
+      "step": 300
+    },
+    {
+      "epoch": 0.89,
+      "learning_rate": 1.8221574344023327e-05,
+      "loss": 0.3736,
+      "step": 305
+    },
+    {
+      "epoch": 0.9,
+      "learning_rate": 1.8192419825072887e-05,
+      "loss": 0.3657,
+      "step": 310
+    },
+    {
+      "epoch": 0.92,
+      "learning_rate": 1.816326530612245e-05,
+      "loss": 0.3591,
+      "step": 315
+    },
+    {
+      "epoch": 0.93,
+      "learning_rate": 1.813411078717201e-05,
+      "loss": 0.374,
+      "step": 320
+    },
+    {
+      "epoch": 0.95,
+      "learning_rate": 1.8104956268221575e-05,
+      "loss": 0.3747,
+      "step": 325
+    },
+    {
+      "epoch": 0.96,
+      "learning_rate": 1.807580174927114e-05,
+      "loss": 0.3609,
+      "step": 330
+    },
+    {
+      "epoch": 0.98,
+      "learning_rate": 1.8046647230320703e-05,
+      "loss": 0.3342,
+      "step": 335
+    },
+    {
+      "epoch": 0.99,
+      "learning_rate": 1.8017492711370263e-05,
+      "loss": 0.363,
+      "step": 340
+    },
+    {
+      "epoch": 1.01,
+      "learning_rate": 1.7988338192419827e-05,
+      "loss": 0.3569,
+      "step": 345
+    },
+    {
+      "epoch": 1.02,
+      "learning_rate": 1.795918367346939e-05,
+      "loss": 0.3517,
+      "step": 350
+    },
+    {
+      "epoch": 1.03,
+      "learning_rate": 1.793002915451895e-05,
+      "loss": 0.356,
+      "step": 355
+    },
+    {
+      "epoch": 1.05,
+      "learning_rate": 1.7900874635568515e-05,
+      "loss": 0.3314,
+      "step": 360
+    },
+    {
+      "epoch": 1.06,
+      "learning_rate": 1.7871720116618075e-05,
+      "loss": 0.3404,
+      "step": 365
+    },
+    {
+      "epoch": 1.08,
+      "learning_rate": 1.7842565597667642e-05,
+      "loss": 0.331,
+      "step": 370
+    },
+    {
+      "epoch": 1.09,
+      "learning_rate": 1.7813411078717202e-05,
+      "loss": 0.343,
+      "step": 375
+    },
+    {
+      "epoch": 1.11,
+      "learning_rate": 1.7784256559766766e-05,
+      "loss": 0.3249,
+      "step": 380
+    },
+    {
+      "epoch": 1.12,
+      "learning_rate": 1.7755102040816327e-05,
+      "loss": 0.3284,
+      "step": 385
+    },
+    {
+      "epoch": 1.14,
+      "learning_rate": 1.772594752186589e-05,
+      "loss": 0.3297,
+      "step": 390
+    },
+    {
+      "epoch": 1.15,
+      "learning_rate": 1.7696793002915454e-05,
+      "loss": 0.3462,
+      "step": 395
+    },
+    {
+      "epoch": 1.17,
+      "learning_rate": 1.7667638483965014e-05,
+      "loss": 0.3318,
+      "step": 400
+    },
+    {
+      "epoch": 1.17,
+      "eval_accuracy": 0.7431793254729915,
+      "eval_accuracy_sklearn": 0.7431793254729915,
+      "eval_f1": 0.67462764340614,
+      "eval_loss": 0.5504330396652222,
+      "eval_precision": 0.650531781257851,
+      "eval_recall": 0.7005772005772006,
+      "eval_runtime": 168.6146,
+      "eval_samples_per_second": 173.034,
+      "eval_steps_per_second": 10.818,
+      "step": 400
+    },
+    {
+      "epoch": 1.18,
+      "learning_rate": 1.7638483965014578e-05,
+      "loss": 0.3257,
+      "step": 405
+    },
+    {
+      "epoch": 1.2,
+      "learning_rate": 1.7609329446064142e-05,
+      "loss": 0.3325,
+      "step": 410
+    },
+    {
+      "epoch": 1.21,
+      "learning_rate": 1.7580174927113706e-05,
+      "loss": 0.3346,
+      "step": 415
+    },
+    {
+      "epoch": 1.22,
+      "learning_rate": 1.7551020408163266e-05,
+      "loss": 0.3549,
+      "step": 420
+    },
+    {
+      "epoch": 1.24,
+      "learning_rate": 1.752186588921283e-05,
+      "loss": 0.344,
+      "step": 425
+    },
+    {
+      "epoch": 1.25,
+      "learning_rate": 1.749271137026239e-05,
+      "loss": 0.3504,
+      "step": 430
+    },
+    {
+      "epoch": 1.27,
+      "learning_rate": 1.7463556851311957e-05,
+      "loss": 0.3281,
+      "step": 435
+    },
+    {
+      "epoch": 1.28,
+      "learning_rate": 1.7434402332361518e-05,
+      "loss": 0.3515,
+      "step": 440
+    },
+    {
+      "epoch": 1.3,
+      "learning_rate": 1.7405247813411078e-05,
+      "loss": 0.3384,
+      "step": 445
+    },
+    {
+      "epoch": 1.31,
+      "learning_rate": 1.7376093294460642e-05,
+      "loss": 0.339,
+      "step": 450
+    },
+    {
+      "epoch": 1.33,
+      "learning_rate": 1.7346938775510206e-05,
+      "loss": 0.3186,
+      "step": 455
+    },
+    {
+      "epoch": 1.34,
+      "learning_rate": 1.731778425655977e-05,
+      "loss": 0.3471,
+      "step": 460
+    },
+    {
+      "epoch": 1.36,
+      "learning_rate": 1.728862973760933e-05,
+      "loss": 0.333,
+      "step": 465
+    },
+    {
+      "epoch": 1.37,
+      "learning_rate": 1.7259475218658894e-05,
+      "loss": 0.2864,
+      "step": 470
+    },
+    {
+      "epoch": 1.38,
+      "learning_rate": 1.7230320699708457e-05,
+      "loss": 0.3198,
+      "step": 475
+    },
+    {
+      "epoch": 1.4,
+      "learning_rate": 1.720116618075802e-05,
+      "loss": 0.3165,
+      "step": 480
+    },
+    {
+      "epoch": 1.41,
+      "learning_rate": 1.717201166180758e-05,
+      "loss": 0.3007,
+      "step": 485
+    },
+    {
+      "epoch": 1.43,
+      "learning_rate": 1.7142857142857142e-05,
+      "loss": 0.2981,
+      "step": 490
+    },
+    {
+      "epoch": 1.44,
+      "learning_rate": 1.7113702623906706e-05,
+      "loss": 0.3166,
+      "step": 495
+    },
+    {
+      "epoch": 1.46,
+      "learning_rate": 1.708454810495627e-05,
+      "loss": 0.3288,
+      "step": 500
+    },
+    {
+      "epoch": 1.47,
+      "learning_rate": 1.7055393586005833e-05,
+      "loss": 0.3078,
+      "step": 505
+    },
+    {
+      "epoch": 1.49,
+      "learning_rate": 1.7026239067055393e-05,
+      "loss": 0.3049,
+      "step": 510
+    },
+    {
+      "epoch": 1.5,
+      "learning_rate": 1.6997084548104957e-05,
+      "loss": 0.3075,
+      "step": 515
+    },
+    {
+      "epoch": 1.52,
+      "learning_rate": 1.696793002915452e-05,
+      "loss": 0.3119,
+      "step": 520
+    },
+    {
+      "epoch": 1.53,
+      "learning_rate": 1.6938775510204085e-05,
+      "loss": 0.3032,
+      "step": 525
+    },
+    {
+      "epoch": 1.55,
+      "learning_rate": 1.6909620991253645e-05,
+      "loss": 0.2987,
+      "step": 530
+    },
+    {
+      "epoch": 1.56,
+      "learning_rate": 1.688046647230321e-05,
+      "loss": 0.324,
+      "step": 535
+    },
+    {
+      "epoch": 1.57,
+      "learning_rate": 1.6851311953352773e-05,
+      "loss": 0.3209,
+      "step": 540
+    },
+    {
+      "epoch": 1.59,
+      "learning_rate": 1.6822157434402333e-05,
+      "loss": 0.2964,
+      "step": 545
+    },
+    {
+      "epoch": 1.6,
+      "learning_rate": 1.6793002915451897e-05,
+      "loss": 0.3002,
+      "step": 550
+    },
+    {
+      "epoch": 1.62,
+      "learning_rate": 1.6763848396501457e-05,
+      "loss": 0.2872,
+      "step": 555
+    },
+    {
+      "epoch": 1.63,
+      "learning_rate": 1.673469387755102e-05,
+      "loss": 0.2999,
+      "step": 560
+    },
+    {
+      "epoch": 1.65,
+      "learning_rate": 1.6705539358600585e-05,
+      "loss": 0.3005,
+      "step": 565
+    },
+    {
+      "epoch": 1.66,
+      "learning_rate": 1.667638483965015e-05,
+      "loss": 0.2931,
+      "step": 570
+    },
+    {
+      "epoch": 1.68,
+      "learning_rate": 1.664723032069971e-05,
+      "loss": 0.2708,
+      "step": 575
+    },
+    {
+      "epoch": 1.69,
+      "learning_rate": 1.6618075801749273e-05,
+      "loss": 0.2525,
+      "step": 580
+    },
+    {
+      "epoch": 1.71,
+      "learning_rate": 1.6588921282798836e-05,
+      "loss": 0.2908,
+      "step": 585
+    },
+    {
+      "epoch": 1.72,
+      "learning_rate": 1.6559766763848397e-05,
+      "loss": 0.2732,
+      "step": 590
+    },
+    {
+      "epoch": 1.73,
+      "learning_rate": 1.653061224489796e-05,
+      "loss": 0.2932,
+      "step": 595
+    },
+    {
+      "epoch": 1.75,
+      "learning_rate": 1.6501457725947524e-05,
+      "loss": 0.2876,
+      "step": 600
+    },
+    {
+      "epoch": 1.75,
+      "eval_accuracy": 0.7540444200712915,
+      "eval_accuracy_sklearn": 0.7540444200712915,
+      "eval_f1": 0.6790984706198014,
+      "eval_loss": 0.5282062292098999,
+      "eval_precision": 0.6734965407131452,
+      "eval_recall": 0.6847943722943723,
+      "eval_runtime": 192.3562,
+      "eval_samples_per_second": 151.677,
+      "eval_steps_per_second": 9.482,
+      "step": 600
+    },
+    {
+      "epoch": 1.76,
+      "learning_rate": 1.6472303206997088e-05,
+      "loss": 0.302,
+      "step": 605
+    },
+    {
+      "epoch": 1.78,
+      "learning_rate": 1.644314868804665e-05,
+      "loss": 0.2874,
+      "step": 610
+    },
+    {
+      "epoch": 1.79,
+      "learning_rate": 1.6413994169096212e-05,
+      "loss": 0.2704,
+      "step": 615
+    },
+    {
+      "epoch": 1.81,
+      "learning_rate": 1.6384839650145773e-05,
+      "loss": 0.2649,
+      "step": 620
+    },
+    {
+      "epoch": 1.82,
+      "learning_rate": 1.6355685131195336e-05,
+      "loss": 0.2798,
+      "step": 625
+    },
+    {
+      "epoch": 1.84,
+      "learning_rate": 1.63265306122449e-05,
+      "loss": 0.2794,
+      "step": 630
+    },
+    {
+      "epoch": 1.85,
+      "learning_rate": 1.629737609329446e-05,
+      "loss": 0.2658,
+      "step": 635
+    },
+    {
+      "epoch": 1.87,
+      "learning_rate": 1.6268221574344024e-05,
+      "loss": 0.2816,
+      "step": 640
+    },
+    {
+      "epoch": 1.88,
+      "learning_rate": 1.6239067055393588e-05,
+      "loss": 0.2817,
+      "step": 645
+    },
+    {
+      "epoch": 1.9,
+      "learning_rate": 1.6209912536443152e-05,
+      "loss": 0.2698,
+      "step": 650
+    },
+    {
+      "epoch": 1.91,
+      "learning_rate": 1.6180758017492712e-05,
+      "loss": 0.2797,
+      "step": 655
+    },
+    {
+      "epoch": 1.92,
+      "learning_rate": 1.6151603498542276e-05,
+      "loss": 0.2941,
+      "step": 660
+    },
+    {
+      "epoch": 1.94,
+      "learning_rate": 1.612244897959184e-05,
+      "loss": 0.2784,
+      "step": 665
+    },
+    {
+      "epoch": 1.95,
+      "learning_rate": 1.60932944606414e-05,
+      "loss": 0.2913,
+      "step": 670
+    },
+    {
+      "epoch": 1.97,
+      "learning_rate": 1.6064139941690964e-05,
+      "loss": 0.2609,
+      "step": 675
+    },
+    {
+      "epoch": 1.98,
+      "learning_rate": 1.6034985422740524e-05,
+      "loss": 0.2767,
+      "step": 680
+    },
+    {
+      "epoch": 2.0,
+      "learning_rate": 1.6005830903790088e-05,
+      "loss": 0.2816,
+      "step": 685
+    },
+    {
+      "epoch": 2.01,
+      "learning_rate": 1.597667638483965e-05,
+      "loss": 0.2703,
+      "step": 690
+    },
+    {
+      "epoch": 2.03,
+      "learning_rate": 1.5947521865889215e-05,
+      "loss": 0.2857,
+      "step": 695
+    },
+    {
+      "epoch": 2.04,
+      "learning_rate": 1.5918367346938776e-05,
+      "loss": 0.2429,
+      "step": 700
+    },
+    {
+      "epoch": 2.06,
+      "learning_rate": 1.588921282798834e-05,
+      "loss": 0.2597,
+      "step": 705
+    },
+    {
+      "epoch": 2.07,
+      "learning_rate": 1.5860058309037903e-05,
+      "loss": 0.2666,
+      "step": 710
+    },
+    {
+      "epoch": 2.08,
+      "learning_rate": 1.5830903790087464e-05,
+      "loss": 0.2438,
+      "step": 715
+    },
+    {
+      "epoch": 2.1,
+      "learning_rate": 1.5801749271137027e-05,
+      "loss": 0.2628,
+      "step": 720
+    },
+    {
+      "epoch": 2.11,
+      "learning_rate": 1.577259475218659e-05,
+      "loss": 0.2574,
+      "step": 725
+    },
+    {
+      "epoch": 2.13,
+      "learning_rate": 1.5743440233236155e-05,
+      "loss": 0.2444,
+      "step": 730
+    },
+    {
+      "epoch": 2.14,
+      "learning_rate": 1.5714285714285715e-05,
+      "loss": 0.2554,
+      "step": 735
+    },
+    {
+      "epoch": 2.16,
+      "learning_rate": 1.568513119533528e-05,
+      "loss": 0.2508,
+      "step": 740
+    },
+    {
+      "epoch": 2.17,
+      "learning_rate": 1.565597667638484e-05,
+      "loss": 0.2386,
+      "step": 745
+    },
+    {
+      "epoch": 2.19,
+      "learning_rate": 1.5626822157434403e-05,
+      "loss": 0.2509,
+      "step": 750
+    },
+    {
+      "epoch": 2.2,
+      "learning_rate": 1.5597667638483967e-05,
+      "loss": 0.2644,
+      "step": 755
+    },
+    {
+      "epoch": 2.22,
+      "learning_rate": 1.5568513119533527e-05,
+      "loss": 0.2683,
+      "step": 760
+    },
+    {
+      "epoch": 2.23,
+      "learning_rate": 1.553935860058309e-05,
+      "loss": 0.2637,
+      "step": 765
+    },
+    {
+      "epoch": 2.24,
+      "learning_rate": 1.5510204081632655e-05,
+      "loss": 0.2588,
+      "step": 770
+    },
+    {
+      "epoch": 2.26,
+      "learning_rate": 1.548104956268222e-05,
+      "loss": 0.2567,
+      "step": 775
+    },
+    {
+      "epoch": 2.27,
+      "learning_rate": 1.545189504373178e-05,
+      "loss": 0.2339,
+      "step": 780
+    },
+    {
+      "epoch": 2.29,
+      "learning_rate": 1.5422740524781343e-05,
+      "loss": 0.246,
+      "step": 785
+    },
+    {
+      "epoch": 2.3,
+      "learning_rate": 1.5393586005830907e-05,
+      "loss": 0.2458,
+      "step": 790
+    },
+    {
+      "epoch": 2.32,
+      "learning_rate": 1.5364431486880467e-05,
+      "loss": 0.2464,
+      "step": 795
+    },
+    {
+      "epoch": 2.33,
+      "learning_rate": 1.533527696793003e-05,
+      "loss": 0.2495,
+      "step": 800
+    },
+    {
+      "epoch": 2.33,
+      "eval_accuracy": 0.7544899917740608,
+      "eval_accuracy_sklearn": 0.7544899917740608,
+      "eval_f1": 0.6955412929825308,
+      "eval_loss": 0.5660556554794312,
+      "eval_precision": 0.657769917195916,
+      "eval_recall": 0.737914862914863,
+      "eval_runtime": 168.3317,
+      "eval_samples_per_second": 173.324,
+      "eval_steps_per_second": 10.836,
+      "step": 800
+    }
+  ],
+  "max_steps": 3430,
+  "num_train_epochs": 10,
+  "total_flos": 1.0774766072469504e+17,
+  "trial_name": null,
+  "trial_params": null
+}

ranker_9/checkpoint-800/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:2d89bd60f804d35602b8d9d64ae5a06e7c1e709434ab3891a2163119e8fb21fa
+size 3451

ranker_9/checkpoint-800/vocab.json ADDED Viewed

The diff for this file is too large to render. See raw diff