Dranapo commited on Jul 21

Commit

fbe2b43

•

1 Parent(s): 7e9e44e

Upload folder using huggingface_hub

Browse files

Files changed (18) hide show

README.md +26 -0
checkpoint-1326/config.json +43 -0
checkpoint-1326/model.safetensors +3 -0
checkpoint-1326/optimizer.pt +3 -0
checkpoint-1326/rng_state.pth +3 -0
checkpoint-1326/scheduler.pt +3 -0
checkpoint-1326/trainer_state.json +501 -0
checkpoint-1326/training_args.bin +3 -0
config.json +43 -0
model.safetensors +3 -0
runs/Jul20_23-38-15_r-dranapo-space01-vxfjy3w1-e8c59-m72yt/events.out.tfevents.1721518697.r-dranapo-space01-vxfjy3w1-e8c59-m72yt.99.0 +2 -2
runs/Jul20_23-38-15_r-dranapo-space01-vxfjy3w1-e8c59-m72yt/events.out.tfevents.1721527499.r-dranapo-space01-vxfjy3w1-e8c59-m72yt.99.1 +3 -0
special_tokens_map.json +7 -0
tokenizer.json +0 -0
tokenizer_config.json +58 -0
training_args.bin +3 -0
training_params.json +30 -0
vocab.txt +0 -0

README.md ADDED Viewed

	@@ -0,0 +1,26 @@

+---
+tags:
+- autotrain
+- text-classification
+base_model: pucpr/biobertpt-all
+widget:
+- text: "I love AutoTrain"
+---
+# Model Trained Using AutoTrain
+- Problem type: Text Classification
+## Validation Metrics
+loss: 0.3162839710712433
+f1: 0.6180555555555556
+precision: 0.644927536231884
+recall: 0.5933333333333334
+auc: 0.8692314688494771
+accuracy: 0.8754246885617214

checkpoint-1326/config.json ADDED Viewed

	@@ -0,0 +1,43 @@

+{
+  "_name_or_path": "pucpr/biobertpt-all",
+  "_num_labels": 2,
+  "architectures": [
+    "BertForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout": null,
+  "directionality": "bidi",
+  "eos_token_ids": null,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "id2label": {
+    "0": "0.0",
+    "1": "1.0"
+  },
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "label2id": {
+    "0.0": 0,
+    "1.0": 1
+  },
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "bert",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "output_past": true,
+  "pad_token_id": null,
+  "pooler_fc_size": 768,
+  "pooler_num_attention_heads": 12,
+  "pooler_num_fc_layers": 3,
+  "pooler_size_per_head": 128,
+  "pooler_type": "first_token_transform",
+  "position_embedding_type": "absolute",
+  "problem_type": "single_label_classification",
+  "torch_dtype": "float32",
+  "transformers_version": "4.42.2",
+  "type_vocab_size": 2,
+  "use_cache": true,
+  "vocab_size": 119547
+}

checkpoint-1326/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9a3b19b3d61b1910c09bc770b4129967382b8f1296decf316070d9897b55e9a8
+size 711443456

checkpoint-1326/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:19f798dc4c66218389df732900708d096d5349d0c95793d808add7c1cce07311
+size 1423002362

checkpoint-1326/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:6018d43ae29133ff7d5566322f40ade3c01692f822ceda0689f84df253c26eb4
+size 13990

checkpoint-1326/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:3db9c07d7c890a067ff5ec897b943e3315acd23995675bff90676049bd7f7c10
+size 1064

checkpoint-1326/trainer_state.json ADDED Viewed

	@@ -0,0 +1,501 @@

+{
+  "best_metric": 0.3162839710712433,
+  "best_model_checkpoint": "autotrain-ytgys-osuer/checkpoint-1326",
+  "epoch": 3.0,
+  "eval_steps": 500,
+  "global_step": 1326,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.049773755656108594,
+      "grad_norm": 9.081209182739258,
+      "learning_rate": 8.270676691729324e-06,
+      "loss": 0.6296,
+      "step": 22
+    },
+    {
+      "epoch": 0.09954751131221719,
+      "grad_norm": 1.96213698387146,
+      "learning_rate": 1.6541353383458648e-05,
+      "loss": 0.4877,
+      "step": 44
+    },
+    {
+      "epoch": 0.1493212669683258,
+      "grad_norm": 2.1971828937530518,
+      "learning_rate": 2.4812030075187968e-05,
+      "loss": 0.5465,
+      "step": 66
+    },
+    {
+      "epoch": 0.19909502262443438,
+      "grad_norm": 5.049612998962402,
+      "learning_rate": 3.3082706766917295e-05,
+      "loss": 0.5186,
+      "step": 88
+    },
+    {
+      "epoch": 0.248868778280543,
+      "grad_norm": 0.6077613830566406,
+      "learning_rate": 4.135338345864662e-05,
+      "loss": 0.2962,
+      "step": 110
+    },
+    {
+      "epoch": 0.2986425339366516,
+      "grad_norm": 5.124961853027344,
+      "learning_rate": 4.9624060150375936e-05,
+      "loss": 0.5159,
+      "step": 132
+    },
+    {
+      "epoch": 0.34841628959276016,
+      "grad_norm": 1.2383034229278564,
+      "learning_rate": 4.9119865884325234e-05,
+      "loss": 0.5115,
+      "step": 154
+    },
+    {
+      "epoch": 0.39819004524886875,
+      "grad_norm": 4.597978115081787,
+      "learning_rate": 4.8197820620285e-05,
+      "loss": 0.4524,
+      "step": 176
+    },
+    {
+      "epoch": 0.4479638009049774,
+      "grad_norm": 4.115572452545166,
+      "learning_rate": 4.727577535624476e-05,
+      "loss": 0.4217,
+      "step": 198
+    },
+    {
+      "epoch": 0.497737556561086,
+      "grad_norm": 1.8618402481079102,
+      "learning_rate": 4.635373009220453e-05,
+      "loss": 0.325,
+      "step": 220
+    },
+    {
+      "epoch": 0.5475113122171946,
+      "grad_norm": 4.649389743804932,
+      "learning_rate": 4.5431684828164296e-05,
+      "loss": 0.4603,
+      "step": 242
+    },
+    {
+      "epoch": 0.5972850678733032,
+      "grad_norm": 2.3018507957458496,
+      "learning_rate": 4.450963956412406e-05,
+      "loss": 0.4817,
+      "step": 264
+    },
+    {
+      "epoch": 0.6470588235294118,
+      "grad_norm": 1.6560252904891968,
+      "learning_rate": 4.358759430008382e-05,
+      "loss": 0.4588,
+      "step": 286
+    },
+    {
+      "epoch": 0.6968325791855203,
+      "grad_norm": 1.248030185699463,
+      "learning_rate": 4.266554903604359e-05,
+      "loss": 0.4533,
+      "step": 308
+    },
+    {
+      "epoch": 0.746606334841629,
+      "grad_norm": 7.337639808654785,
+      "learning_rate": 4.174350377200336e-05,
+      "loss": 0.5258,
+      "step": 330
+    },
+    {
+      "epoch": 0.7963800904977375,
+      "grad_norm": 3.778733253479004,
+      "learning_rate": 4.0821458507963125e-05,
+      "loss": 0.4715,
+      "step": 352
+    },
+    {
+      "epoch": 0.8461538461538461,
+      "grad_norm": 2.055952787399292,
+      "learning_rate": 3.9899413243922885e-05,
+      "loss": 0.5279,
+      "step": 374
+    },
+    {
+      "epoch": 0.8959276018099548,
+      "grad_norm": 2.640718460083008,
+      "learning_rate": 3.897736797988265e-05,
+      "loss": 0.4142,
+      "step": 396
+    },
+    {
+      "epoch": 0.9457013574660633,
+      "grad_norm": 2.906071424484253,
+      "learning_rate": 3.805532271584242e-05,
+      "loss": 0.618,
+      "step": 418
+    },
+    {
+      "epoch": 0.995475113122172,
+      "grad_norm": 7.490321159362793,
+      "learning_rate": 3.713327745180218e-05,
+      "loss": 0.4642,
+      "step": 440
+    },
+    {
+      "epoch": 1.0,
+      "eval_accuracy": 0.8301245753114382,
+      "eval_auc": 0.6658117326057298,
+      "eval_f1": 0.0,
+      "eval_loss": 0.468678742647171,
+      "eval_precision": 0.0,
+      "eval_recall": 0.0,
+      "eval_runtime": 155.3554,
+      "eval_samples_per_second": 5.684,
+      "eval_steps_per_second": 0.36,
+      "step": 442
+    },
+    {
+      "epoch": 1.0452488687782806,
+      "grad_norm": 1.7145849466323853,
+      "learning_rate": 3.6211232187761947e-05,
+      "loss": 0.5339,
+      "step": 462
+    },
+    {
+      "epoch": 1.0950226244343892,
+      "grad_norm": 7.355587959289551,
+      "learning_rate": 3.5289186923721714e-05,
+      "loss": 0.4688,
+      "step": 484
+    },
+    {
+      "epoch": 1.1447963800904977,
+      "grad_norm": 8.240862846374512,
+      "learning_rate": 3.436714165968148e-05,
+      "loss": 0.413,
+      "step": 506
+    },
+    {
+      "epoch": 1.1945701357466063,
+      "grad_norm": 4.566345691680908,
+      "learning_rate": 3.344509639564124e-05,
+      "loss": 0.4214,
+      "step": 528
+    },
+    {
+      "epoch": 1.244343891402715,
+      "grad_norm": 7.886547088623047,
+      "learning_rate": 3.252305113160101e-05,
+      "loss": 0.5584,
+      "step": 550
+    },
+    {
+      "epoch": 1.2941176470588236,
+      "grad_norm": 4.851104259490967,
+      "learning_rate": 3.1601005867560775e-05,
+      "loss": 0.5674,
+      "step": 572
+    },
+    {
+      "epoch": 1.3438914027149322,
+      "grad_norm": 2.095370054244995,
+      "learning_rate": 3.067896060352054e-05,
+      "loss": 0.4522,
+      "step": 594
+    },
+    {
+      "epoch": 1.3936651583710407,
+      "grad_norm": 1.348547339439392,
+      "learning_rate": 2.9756915339480303e-05,
+      "loss": 0.4711,
+      "step": 616
+    },
+    {
+      "epoch": 1.4434389140271493,
+      "grad_norm": 1.514244556427002,
+      "learning_rate": 2.8834870075440066e-05,
+      "loss": 0.3652,
+      "step": 638
+    },
+    {
+      "epoch": 1.493212669683258,
+      "grad_norm": 2.2231717109680176,
+      "learning_rate": 2.7912824811399834e-05,
+      "loss": 0.4884,
+      "step": 660
+    },
+    {
+      "epoch": 1.5429864253393664,
+      "grad_norm": 4.4252777099609375,
+      "learning_rate": 2.69907795473596e-05,
+      "loss": 0.4066,
+      "step": 682
+    },
+    {
+      "epoch": 1.5927601809954752,
+      "grad_norm": 2.0143589973449707,
+      "learning_rate": 2.606873428331936e-05,
+      "loss": 0.4817,
+      "step": 704
+    },
+    {
+      "epoch": 1.6425339366515836,
+      "grad_norm": 1.2555855512619019,
+      "learning_rate": 2.5146689019279128e-05,
+      "loss": 0.4505,
+      "step": 726
+    },
+    {
+      "epoch": 1.6923076923076923,
+      "grad_norm": 1.5008816719055176,
+      "learning_rate": 2.4224643755238895e-05,
+      "loss": 0.4987,
+      "step": 748
+    },
+    {
+      "epoch": 1.742081447963801,
+      "grad_norm": 1.0928298234939575,
+      "learning_rate": 2.330259849119866e-05,
+      "loss": 0.4491,
+      "step": 770
+    },
+    {
+      "epoch": 1.7918552036199094,
+      "grad_norm": 2.131342887878418,
+      "learning_rate": 2.2380553227158423e-05,
+      "loss": 0.5099,
+      "step": 792
+    },
+    {
+      "epoch": 1.8416289592760182,
+      "grad_norm": 2.0319790840148926,
+      "learning_rate": 2.145850796311819e-05,
+      "loss": 0.4312,
+      "step": 814
+    },
+    {
+      "epoch": 1.8914027149321266,
+      "grad_norm": 3.668442726135254,
+      "learning_rate": 2.0536462699077953e-05,
+      "loss": 0.414,
+      "step": 836
+    },
+    {
+      "epoch": 1.9411764705882353,
+      "grad_norm": 1.9720642566680908,
+      "learning_rate": 1.961441743503772e-05,
+      "loss": 0.3894,
+      "step": 858
+    },
+    {
+      "epoch": 1.990950226244344,
+      "grad_norm": 4.421242713928223,
+      "learning_rate": 1.8692372170997484e-05,
+      "loss": 0.4847,
+      "step": 880
+    },
+    {
+      "epoch": 2.0,
+      "eval_accuracy": 0.8301245753114382,
+      "eval_auc": 0.7693769895407002,
+      "eval_f1": 0.0,
+      "eval_loss": 0.45319485664367676,
+      "eval_precision": 0.0,
+      "eval_recall": 0.0,
+      "eval_runtime": 156.7435,
+      "eval_samples_per_second": 5.633,
+      "eval_steps_per_second": 0.357,
+      "step": 884
+    },
+    {
+      "epoch": 2.0407239819004523,
+      "grad_norm": 4.845108985900879,
+      "learning_rate": 1.777032690695725e-05,
+      "loss": 0.426,
+      "step": 902
+    },
+    {
+      "epoch": 2.090497737556561,
+      "grad_norm": 4.742054462432861,
+      "learning_rate": 1.6848281642917015e-05,
+      "loss": 0.4253,
+      "step": 924
+    },
+    {
+      "epoch": 2.1402714932126696,
+      "grad_norm": 27.354101181030273,
+      "learning_rate": 1.5926236378876782e-05,
+      "loss": 0.4168,
+      "step": 946
+    },
+    {
+      "epoch": 2.1900452488687785,
+      "grad_norm": 9.501100540161133,
+      "learning_rate": 1.5004191114836546e-05,
+      "loss": 0.4337,
+      "step": 968
+    },
+    {
+      "epoch": 2.239819004524887,
+      "grad_norm": 2.986358165740967,
+      "learning_rate": 1.4082145850796313e-05,
+      "loss": 0.3713,
+      "step": 990
+    },
+    {
+      "epoch": 2.2895927601809953,
+      "grad_norm": 13.785974502563477,
+      "learning_rate": 1.3160100586756077e-05,
+      "loss": 0.3517,
+      "step": 1012
+    },
+    {
+      "epoch": 2.339366515837104,
+      "grad_norm": 6.597299098968506,
+      "learning_rate": 1.2238055322715842e-05,
+      "loss": 0.362,
+      "step": 1034
+    },
+    {
+      "epoch": 2.3891402714932126,
+      "grad_norm": 1.9302808046340942,
+      "learning_rate": 1.1316010058675607e-05,
+      "loss": 0.3733,
+      "step": 1056
+    },
+    {
+      "epoch": 2.4389140271493215,
+      "grad_norm": 1.2917982339859009,
+      "learning_rate": 1.0393964794635373e-05,
+      "loss": 0.3184,
+      "step": 1078
+    },
+    {
+      "epoch": 2.48868778280543,
+      "grad_norm": 2.898386240005493,
+      "learning_rate": 9.471919530595138e-06,
+      "loss": 0.4959,
+      "step": 1100
+    },
+    {
+      "epoch": 2.5384615384615383,
+      "grad_norm": 5.883040904998779,
+      "learning_rate": 8.549874266554904e-06,
+      "loss": 0.3014,
+      "step": 1122
+    },
+    {
+      "epoch": 2.588235294117647,
+      "grad_norm": 10.006911277770996,
+      "learning_rate": 7.627829002514669e-06,
+      "loss": 0.3047,
+      "step": 1144
+    },
+    {
+      "epoch": 2.6380090497737556,
+      "grad_norm": 3.732818365097046,
+      "learning_rate": 6.7057837384744345e-06,
+      "loss": 0.382,
+      "step": 1166
+    },
+    {
+      "epoch": 2.6877828054298645,
+      "grad_norm": 4.408326148986816,
+      "learning_rate": 5.7837384744342e-06,
+      "loss": 0.3173,
+      "step": 1188
+    },
+    {
+      "epoch": 2.737556561085973,
+      "grad_norm": 7.149359226226807,
+      "learning_rate": 4.861693210393965e-06,
+      "loss": 0.4387,
+      "step": 1210
+    },
+    {
+      "epoch": 2.7873303167420813,
+      "grad_norm": 9.934762001037598,
+      "learning_rate": 3.939647946353731e-06,
+      "loss": 0.2751,
+      "step": 1232
+    },
+    {
+      "epoch": 2.83710407239819,
+      "grad_norm": 5.656704902648926,
+      "learning_rate": 3.0176026823134957e-06,
+      "loss": 0.3792,
+      "step": 1254
+    },
+    {
+      "epoch": 2.8868778280542986,
+      "grad_norm": 7.494544506072998,
+      "learning_rate": 2.095557418273261e-06,
+      "loss": 0.3882,
+      "step": 1276
+    },
+    {
+      "epoch": 2.9366515837104075,
+      "grad_norm": 12.555413246154785,
+      "learning_rate": 1.173512154233026e-06,
+      "loss": 0.3562,
+      "step": 1298
+    },
+    {
+      "epoch": 2.986425339366516,
+      "grad_norm": 8.668551445007324,
+      "learning_rate": 2.5146689019279127e-07,
+      "loss": 0.2171,
+      "step": 1320
+    },
+    {
+      "epoch": 3.0,
+      "eval_accuracy": 0.8754246885617214,
+      "eval_auc": 0.8692314688494771,
+      "eval_f1": 0.6180555555555556,
+      "eval_loss": 0.3162839710712433,
+      "eval_precision": 0.644927536231884,
+      "eval_recall": 0.5933333333333334,
+      "eval_runtime": 161.1074,
+      "eval_samples_per_second": 5.481,
+      "eval_steps_per_second": 0.348,
+      "step": 1326
+    }
+  ],
+  "logging_steps": 22,
+  "max_steps": 1326,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 3,
+  "save_steps": 500,
+  "stateful_callbacks": {
+    "EarlyStoppingCallback": {
+      "args": {
+        "early_stopping_patience": 5,
+        "early_stopping_threshold": 0.01
+      },
+      "attributes": {
+        "early_stopping_patience_counter": 0
+      }
+    },
+    "TrainerControl": {
+      "args": {
+        "should_epoch_stop": false,
+        "should_evaluate": false,
+        "should_log": false,
+        "should_save": true,
+        "should_training_stop": true
+      },
+      "attributes": {}
+    }
+  },
+  "total_flos": 696981185648640.0,
+  "train_batch_size": 8,
+  "trial_name": null,
+  "trial_params": null
+}

checkpoint-1326/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:489e21a6d8bb5de7892fec4df3096a382c590886147badf6e74f59000c39669e
+size 5176

config.json ADDED Viewed

	@@ -0,0 +1,43 @@

+{
+  "_name_or_path": "pucpr/biobertpt-all",
+  "_num_labels": 2,
+  "architectures": [
+    "BertForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout": null,
+  "directionality": "bidi",
+  "eos_token_ids": null,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "id2label": {
+    "0": "0.0",
+    "1": "1.0"
+  },
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "label2id": {
+    "0.0": 0,
+    "1.0": 1
+  },
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "bert",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "output_past": true,
+  "pad_token_id": null,
+  "pooler_fc_size": 768,
+  "pooler_num_attention_heads": 12,
+  "pooler_num_fc_layers": 3,
+  "pooler_size_per_head": 128,
+  "pooler_type": "first_token_transform",
+  "position_embedding_type": "absolute",
+  "problem_type": "single_label_classification",
+  "torch_dtype": "float32",
+  "transformers_version": "4.42.2",
+  "type_vocab_size": 2,
+  "use_cache": true,
+  "vocab_size": 119547
+}

model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9a3b19b3d61b1910c09bc770b4129967382b8f1296decf316070d9897b55e9a8
+size 711443456

runs/Jul20_23-38-15_r-dranapo-space01-vxfjy3w1-e8c59-m72yt/events.out.tfevents.1721518697.r-dranapo-space01-vxfjy3w1-e8c59-m72yt.99.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:16c66188ca2647bda76edeed670000a2fff338d61c3c0f1831d8a29b75696fb9
-size 17815

 version https://git-lfs.github.com/spec/v1
+oid sha256:f79cdb22b3e6768390b5422585828a6d02eee7156b6cfb58ece0a1a2cba32712
+size 19743

runs/Jul20_23-38-15_r-dranapo-space01-vxfjy3w1-e8c59-m72yt/events.out.tfevents.1721527499.r-dranapo-space01-vxfjy3w1-e8c59-m72yt.99.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4ea0f220c9e83d99bc0d8567635b2d9be0495759d5b4276c5722e6b98d119bd2
+size 607

special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,7 @@

+{
+  "cls_token": "[CLS]",
+  "mask_token": "[MASK]",
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "unk_token": "[UNK]"
+}

tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,58 @@

+{
+  "added_tokens_decoder": {
+    "0": {
+      "content": "[PAD]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "100": {
+      "content": "[UNK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "101": {
+      "content": "[CLS]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "102": {
+      "content": "[SEP]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "103": {
+      "content": "[MASK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "clean_up_tokenization_spaces": true,
+  "cls_token": "[CLS]",
+  "do_basic_tokenize": true,
+  "do_lower_case": false,
+  "mask_token": "[MASK]",
+  "max_len": 512,
+  "model_max_length": 512,
+  "never_split": null,
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "strip_accents": null,
+  "tokenize_chinese_chars": true,
+  "tokenizer_class": "BertTokenizer",
+  "unk_token": "[UNK]"
+}

training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:489e21a6d8bb5de7892fec4df3096a382c590886147badf6e74f59000c39669e
+size 5176

training_params.json ADDED Viewed

	@@ -0,0 +1,30 @@

+{
+    "data_path": "autotrain-ytgys-osuer/autotrain-data",
+    "model": "pucpr/biobertpt-all",
+    "lr": 5e-05,
+    "epochs": 3,
+    "max_seq_length": 128,
+    "batch_size": 8,
+    "warmup_ratio": 0.1,
+    "gradient_accumulation": 1,
+    "optimizer": "adamw_torch",
+    "scheduler": "linear",
+    "weight_decay": 0.0,
+    "max_grad_norm": 1.0,
+    "seed": 42,
+    "train_split": "train",
+    "valid_split": "validation",
+    "text_column": "autotrain_text",
+    "target_column": "autotrain_label",
+    "logging_steps": -1,
+    "project_name": "autotrain-ytgys-osuer",
+    "auto_find_batch_size": false,
+    "mixed_precision": "fp16",
+    "save_total_limit": 1,
+    "push_to_hub": true,
+    "eval_strategy": "epoch",
+    "username": "Dranapo",
+    "log": "tensorboard",
+    "early_stopping_patience": 5,
+    "early_stopping_threshold": 0.01
+}

vocab.txt ADDED Viewed

The diff for this file is too large to render. See raw diff