Upload tokenizer

Files changed (3) hide show

added_tokens.json CHANGED Viewed

@@ -1,6 +1,3 @@
 {
-  "</s>": 2,
-  "<pad>": 32000,
-  "<s>": 1,
-  "<unk>": 0
 }

 {
+  "<pad>": 32000
 }

tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

tokenizer_config.json CHANGED Viewed

@@ -1,28 +1,26 @@
 {
-  "add_bos_token": true,
-  "add_eos_token": false,
   "added_tokens_decoder": {
     "0": {
       "content": "<unk>",
-      "lstrip": true,
       "normalized": false,
-      "rstrip": true,
       "single_word": false,
       "special": true
     },
     "1": {
       "content": "<s>",
-      "lstrip": true,
       "normalized": false,
-      "rstrip": true,
       "single_word": false,
       "special": true
     },
     "2": {
       "content": "</s>",
-      "lstrip": true,
       "normalized": false,
-      "rstrip": true,
       "single_word": false,
       "special": true
     },
@@ -45,9 +43,6 @@
   "sp_model_kwargs": {},
   "spaces_between_special_tokens": false,
   "tokenizer_class": "LlamaTokenizer",
-  "tokenizer_file": null,
-  "trust_remote_code": false,
   "unk_token": "<unk>",
-  "use_default_system_prompt": true,
-  "use_fast": true
 }

 {
   "added_tokens_decoder": {
     "0": {
       "content": "<unk>",
+      "lstrip": false,
       "normalized": false,
+      "rstrip": false,
       "single_word": false,
       "special": true
     },
     "1": {
       "content": "<s>",
+      "lstrip": false,
       "normalized": false,
+      "rstrip": false,
       "single_word": false,
       "special": true
     },
     "2": {
       "content": "</s>",
+      "lstrip": false,
       "normalized": false,
+      "rstrip": false,
       "single_word": false,
       "special": true
     },
   "sp_model_kwargs": {},
   "spaces_between_special_tokens": false,
   "tokenizer_class": "LlamaTokenizer",
   "unk_token": "<unk>",
+  "use_default_system_prompt": true
 }