previous commit of bert vendor

Files changed (8) hide show

config.json CHANGED Viewed

@@ -1,30 +1,27 @@
 {
-  "_name_or_path": "microsoft/layoutlm-large-uncased",
   "architectures": [
     "LayoutLMForQuestionAnswering"
   ],
   "attention_probs_dropout_prob": 0.1,
-  "bos_token_id": 0,
   "classifier_dropout": null,
-  "eos_token_id": 2,
-  "gradient_checkpointing": false,
   "hidden_act": "gelu",
   "hidden_dropout_prob": 0.1,
   "hidden_size": 768,
   "initializer_range": 0.02,
   "intermediate_size": 3072,
-  "layer_norm_eps": 1e-05,
   "max_2d_position_embeddings": 1024,
-  "max_position_embeddings": 514,
-  "model_type": "roberta",
   "num_attention_heads": 12,
   "num_hidden_layers": 12,
-  "pad_token_id": 1,
   "position_embedding_type": "absolute",
-  "tokenizer_class": "RobertaTokenizer",
   "torch_dtype": "float32",
-  "transformers_version": "4.23.1",
   "type_vocab_size": 2,
   "use_cache": true,
-  "vocab_size": 50265
 }

 {
+  "_name_or_path": "microsoft/layoutlm-base-uncased",
   "architectures": [
     "LayoutLMForQuestionAnswering"
   ],
   "attention_probs_dropout_prob": 0.1,
   "classifier_dropout": null,
   "hidden_act": "gelu",
   "hidden_dropout_prob": 0.1,
   "hidden_size": 768,
   "initializer_range": 0.02,
   "intermediate_size": 3072,
+  "layer_norm_eps": 1e-12,
   "max_2d_position_embeddings": 1024,
+  "max_position_embeddings": 512,
+  "model_type": "bert",
   "num_attention_heads": 12,
   "num_hidden_layers": 12,
+  "output_past": true,
+  "pad_token_id": 0,
   "position_embedding_type": "absolute",
   "torch_dtype": "float32",
+  "transformers_version": "4.22.2",
   "type_vocab_size": 2,
   "use_cache": true,
+  "vocab_size": 30522
 }

merges.txt DELETED Viewed

The diff for this file is too large to render. See raw diff

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:76321879ebf281a0bdc735ca330337451d10e180ac3fd021a704b00137510021
-size 511247909

 version https://git-lfs.github.com/spec/v1
+oid sha256:1802e85d60683f7abd7e63417d78579ceb47cc176ac574eb2ad67716f8f5b9aa
+size 450591205

special_tokens_map.json CHANGED Viewed

@@ -1,15 +1,7 @@
 {
-  "bos_token": "<s>",
-  "cls_token": "<s>",
-  "eos_token": "</s>",
-  "mask_token": {
-    "content": "<mask>",
-    "lstrip": true,
-    "normalized": false,
-    "rstrip": false,
-    "single_word": false
-  },
-  "pad_token": "<pad>",
-  "sep_token": "</s>",
-  "unk_token": "<unk>"
 }

 {
+  "cls_token": "[CLS]",
+  "mask_token": "[MASK]",
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "unk_token": "[UNK]"
 }

tokenizer_config.json CHANGED Viewed

@@ -1,65 +1,16 @@
 {
-  "add_prefix_space": true,
-  "bos_token": {
-    "__type": "AddedToken",
-    "content": "<s>",
-    "lstrip": false,
-    "normalized": true,
-    "rstrip": false,
-    "single_word": false
-  },
-  "cls_token": {
-    "__type": "AddedToken",
-    "content": "<s>",
-    "lstrip": false,
-    "normalized": true,
-    "rstrip": false,
-    "single_word": false
-  },
   "do_lower_case": true,
-  "eos_token": {
-    "__type": "AddedToken",
-    "content": "</s>",
-    "lstrip": false,
-    "normalized": true,
-    "rstrip": false,
-    "single_word": false
-  },
-  "errors": "replace",
-  "mask_token": {
-    "__type": "AddedToken",
-    "content": "<mask>",
-    "lstrip": true,
-    "normalized": true,
-    "rstrip": false,
-    "single_word": false
-  },
-  "model_max_length": 512,
-  "name_or_path": "impira/layoutlm-document-qa",
-  "pad_token": {
-    "__type": "AddedToken",
-    "content": "<pad>",
-    "lstrip": false,
-    "normalized": true,
-    "rstrip": false,
-    "single_word": false
-  },
-  "sep_token": {
-    "__type": "AddedToken",
-    "content": "</s>",
-    "lstrip": false,
-    "normalized": true,
-    "rstrip": false,
-    "single_word": false
-  },
-  "special_tokens_map_file": null,
-  "tokenizer_class": "RobertaTokenizer",
-  "unk_token": {
-    "__type": "AddedToken",
-    "content": "<unk>",
-    "lstrip": false,
-    "normalized": true,
-    "rstrip": false,
-    "single_word": false
-  }
 }

 {
+  "cls_token": "[CLS]",
+  "do_basic_tokenize": true,
   "do_lower_case": true,
+  "mask_token": "[MASK]",
+  "max_len": 512,
+  "name_or_path": "microsoft/layoutlm-base-uncased",
+  "never_split": null,
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "special_tokens_map_file": "data/models/models--microsoft--layoutlm-base-uncased/snapshots/ca841ce8d2f46b13b0ac3f635b8eb7d2e1d758d5/special_tokens_map.json",
+  "strip_accents": null,
+  "tokenize_chinese_chars": true,
+  "tokenizer_class": "BertTokenizer",
+  "unk_token": "[UNK]"
 }

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:9518cb20ba30d0bc101127dbdfff2574f450d60c3031967b86272a24d6ee0123
-size 1583

 version https://git-lfs.github.com/spec/v1
+oid sha256:c06707d9a8295ab1480fa3cb6ee9e537946e006fb9e60869dbbc0b7422ae8b00
+size 1519

vocab.json DELETED Viewed

The diff for this file is too large to render. See raw diff

vocab.txt ADDED Viewed

The diff for this file is too large to render. See raw diff