Upload 11 files

Browse files

Files changed (9) hide show

config.json +1 -1
optimizer.pt +3 -0
pytorch_model.bin +1 -1
rng_state.pth +3 -0
scheduler.pt +3 -0
tokenizer.json +6 -1
tokenizer_config.json +0 -1
trainer_state.json +121 -0
training_args.bin +3 -0

config.json CHANGED Viewed

@@ -19,7 +19,7 @@
   "position_embedding_type": "absolute",
   "problem_type": "single_label_classification",
   "torch_dtype": "float32",
-  "transformers_version": "4.26.1",
   "type_vocab_size": 2,
   "use_cache": true,
   "vocab_size": 30522

   "position_embedding_type": "absolute",
   "problem_type": "single_label_classification",
   "torch_dtype": "float32",
+  "transformers_version": "4.27.2",
   "type_vocab_size": 2,
   "use_cache": true,
   "vocab_size": 30522

optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c3a143a74d23082f1f82a2e41ac22b1a793980ecd3231eda3e9173249c324df3
+size 35113239

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c1123f8773a4ac68efb5268e6d1bc3f6717e3cc246e7dd9f14be227f182cbcf4
 size 17562607

 version https://git-lfs.github.com/spec/v1
+oid sha256:6e68c6361918fc640e3bf2681c16f3c19135b3345e59ebbc8adae5d4d9294ea1
 size 17562607

rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:68f058b8e93c1324dbf85d44fdc4366391103496f3ace80bdb0a4e77cf714b27
+size 14575

scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d263d8bdf12f1cc9b949bbab432258ae5a64387694fede8f79b989437b7c1928
+size 627

tokenizer.json CHANGED Viewed

@@ -1,6 +1,11 @@
 {
   "version": "1.0",
-  "truncation": null,
   "padding": null,
   "added_tokens": [
     {

 {
   "version": "1.0",
+  "truncation": {
+    "direction": "Right",
+    "max_length": 512,
+    "strategy": "LongestFirst",
+    "stride": 0
+  },
   "padding": null,
   "added_tokens": [
     {

tokenizer_config.json CHANGED Viewed

@@ -4,7 +4,6 @@
   "do_lower_case": true,
   "mask_token": "[MASK]",
   "model_max_length": 512,
-  "name_or_path": "prajjwal1/bert-tiny",
   "never_split": null,
   "pad_token": "[PAD]",
   "sep_token": "[SEP]",

   "do_lower_case": true,
   "mask_token": "[MASK]",
   "model_max_length": 512,
   "never_split": null,
   "pad_token": "[PAD]",
   "sep_token": "[SEP]",

trainer_state.json ADDED Viewed

	@@ -0,0 +1,121 @@

+{
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 1.0,
+  "global_step": 3750,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.13,
+      "learning_rate": 4.3333333333333334e-05,
+      "loss": 0.2385,
+      "step": 500
+    },
+    {
+      "epoch": 0.14,
+      "eval_f1": 0.9824900538642076,
+      "eval_loss": 0.06151168420910835,
+      "eval_runtime": 19.4562,
+      "eval_samples_per_second": 308.386,
+      "eval_steps_per_second": 38.548,
+      "step": 512
+    },
+    {
+      "epoch": 0.27,
+      "learning_rate": 3.6666666666666666e-05,
+      "loss": 0.071,
+      "step": 1000
+    },
+    {
+      "epoch": 0.27,
+      "eval_f1": 0.9883248221286651,
+      "eval_loss": 0.047542937099933624,
+      "eval_runtime": 7.5074,
+      "eval_samples_per_second": 799.21,
+      "eval_steps_per_second": 99.901,
+      "step": 1024
+    },
+    {
+      "epoch": 0.4,
+      "learning_rate": 3e-05,
+      "loss": 0.0659,
+      "step": 1500
+    },
+    {
+      "epoch": 0.41,
+      "eval_f1": 0.9906601900273291,
+      "eval_loss": 0.04389449208974838,
+      "eval_runtime": 6.6018,
+      "eval_samples_per_second": 908.837,
+      "eval_steps_per_second": 113.605,
+      "step": 1536
+    },
+    {
+      "epoch": 0.53,
+      "learning_rate": 2.3333333333333336e-05,
+      "loss": 0.0679,
+      "step": 2000
+    },
+    {
+      "epoch": 0.55,
+      "eval_f1": 0.9919927935141627,
+      "eval_loss": 0.03968248888850212,
+      "eval_runtime": 8.8193,
+      "eval_samples_per_second": 680.326,
+      "eval_steps_per_second": 85.041,
+      "step": 2048
+    },
+    {
+      "epoch": 0.67,
+      "learning_rate": 1.6666666666666667e-05,
+      "loss": 0.0414,
+      "step": 2500
+    },
+    {
+      "epoch": 0.68,
+      "eval_f1": 0.9909945206661297,
+      "eval_loss": 0.044602639973163605,
+      "eval_runtime": 6.4726,
+      "eval_samples_per_second": 926.979,
+      "eval_steps_per_second": 115.872,
+      "step": 2560
+    },
+    {
+      "epoch": 0.8,
+      "learning_rate": 1e-05,
+      "loss": 0.0447,
+      "step": 3000
+    },
+    {
+      "epoch": 0.82,
+      "eval_f1": 0.9926591496358939,
+      "eval_loss": 0.037685297429561615,
+      "eval_runtime": 7.0088,
+      "eval_samples_per_second": 856.061,
+      "eval_steps_per_second": 107.008,
+      "step": 3072
+    },
+    {
+      "epoch": 0.93,
+      "learning_rate": 3.3333333333333333e-06,
+      "loss": 0.0427,
+      "step": 3500
+    },
+    {
+      "epoch": 0.96,
+      "eval_f1": 0.9923271737589343,
+      "eval_loss": 0.03635118156671524,
+      "eval_runtime": 8.2324,
+      "eval_samples_per_second": 728.825,
+      "eval_steps_per_second": 91.103,
+      "step": 3584
+    }
+  ],
+  "max_steps": 3750,
+  "num_train_epochs": 1,
+  "total_flos": 38061091933440.0,
+  "trial_name": null,
+  "trial_params": null
+}

training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4ce0b43e9ca61e7d5315b5924ce3aeee8306761553caebc433ec12aded44e211
+size 3515