Training in progress, epoch 0

Files changed (6) hide show

added_tokens.json ADDED Viewed

+{
+  "</s_1_data_rozhdeniya>": 35075,
+  "</s_1_data_vydachi>": 35063,
+  "</s_1_familiya>": 35067,
+  "</s_1_imya>": 35069,
+  "</s_1_kod_podrazdeleniya>": 35065,
+  "</s_1_mashinnyj_tekst_1>": 35085,
+  "</s_1_mashinnyj_tekst_2>": 35087,
+  "</s_1_mesto_rozhdeniya1>": 35077,
+  "</s_1_mesto_rozhdeniya2>": 35079,
+  "</s_1_mesto_rozhdeniya3>": 35089,
+  "</s_1_otchestvo>": 35071,
+  "</s_1_pasport_vydan1>": 35057,
+  "</s_1_pasport_vydan2>": 35061,
+  "</s_1_pasport_vydan3>": 35091,
+  "</s_1_pol>": 35073,
+  "</s_1_seriya_nomer_1>": 35081,
+  "</s_1_seriya_nomer_2>": 35083,
+  "</s_name>": 35059,
+  "<s_1_data_rozhdeniya>": 35074,
+  "<s_1_data_vydachi>": 35062,
+  "<s_1_familiya>": 35066,
+  "<s_1_imya>": 35068,
+  "<s_1_kod_podrazdeleniya>": 35064,
+  "<s_1_mashinnyj_tekst_1>": 35084,
+  "<s_1_mashinnyj_tekst_2>": 35086,
+  "<s_1_mesto_rozhdeniya1>": 35076,
+  "<s_1_mesto_rozhdeniya2>": 35078,
+  "<s_1_mesto_rozhdeniya3>": 35088,
+  "<s_1_otchestvo>": 35070,
+  "<s_1_pasport_vydan1>": 35056,
+  "<s_1_pasport_vydan2>": 35060,
+  "<s_1_pasport_vydan3>": 35090,
+  "<s_1_pol>": 35072,
+  "<s_1_seriya_nomer_1>": 35080,
+  "<s_1_seriya_nomer_2>": 35082,
+  "<s_500k>": 35054,
+  "<s_a4>": 35092,
+  "<s_donut_rus>": 35055,
+  "<s_name>": 35058
+}

preprocessor_config.json ADDED Viewed

+{
+  "do_align_long_axis": false,
+  "do_normalize": true,
+  "do_pad": true,
+  "do_rescale": true,
+  "do_resize": true,
+  "do_thumbnail": true,
+  "image_mean": [
+    0.5,
+    0.5,
+    0.5
+  ],
+  "image_processor_type": "DonutImageProcessor",
+  "image_std": [
+    0.5,
+    0.5,
+    0.5
+  ],
+  "processor_class": "DonutProcessor",
+  "resample": 2,
+  "rescale_factor": 0.00392156862745098,
+  "size": [
+    1200,
+    1600
+  ]
+}

sentencepiece.bpe.model ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:ef009ae2ede7beded780cfa82e11d2d977473cb6ddf9c3b5bdce3c367497fc01
+size 943862

special_tokens_map.json ADDED Viewed

+{
+  "bos_token": "<s>",
+  "cls_token": "<s>",
+  "eos_token": "</s>",
+  "mask_token": {
+    "content": "<mask>",
+    "lstrip": true,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  },
+  "pad_token": "<pad>",
+  "sep_token": "</s>",
+  "unk_token": "<unk>"
+}

tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

tokenizer_config.json ADDED Viewed

+{
+  "bos_token": "<s>",
+  "clean_up_tokenization_spaces": true,
+  "cls_token": "<s>",
+  "eos_token": "</s>",
+  "mask_token": {
+    "__type": "AddedToken",
+    "content": "<mask>",
+    "lstrip": true,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  },
+  "model_max_length": 1000000000000000019884624838656,
+  "pad_token": "<pad>",
+  "processor_class": "DonutProcessor",
+  "sep_token": "</s>",
+  "sp_model_kwargs": {},
+  "tokenizer_class": "XLMRobertaTokenizer",
+  "unk_token": "<unk>"
+}