Zual commited on
Commit
7bc4bad
1 Parent(s): 49d2391

Upload tokenizer.json with huggingface_hub

Browse files
Files changed (1) hide show
  1. tokenizer.json +267 -0
tokenizer.json ADDED
@@ -0,0 +1,267 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "vocab": {
3
+ "<PAD>": 0,
4
+ "a1": 1,
5
+ "a": 2,
6
+ "1": 3,
7
+ "a2": 4,
8
+ "2": 5,
9
+ "a3": 6,
10
+ "3": 7,
11
+ "a4": 8,
12
+ "4": 9,
13
+ "a5": 10,
14
+ "5": 11,
15
+ "a6": 12,
16
+ "6": 13,
17
+ "a7": 14,
18
+ "7": 15,
19
+ "a8": 16,
20
+ "8": 17,
21
+ "b1": 18,
22
+ "b": 19,
23
+ "b2": 20,
24
+ "b3": 21,
25
+ "b4": 22,
26
+ "b5": 23,
27
+ "b6": 24,
28
+ "b7": 25,
29
+ "b8": 26,
30
+ "c1": 27,
31
+ "c": 28,
32
+ "c2": 29,
33
+ "c3": 30,
34
+ "c4": 31,
35
+ "c5": 32,
36
+ "c6": 33,
37
+ "c7": 34,
38
+ "c8": 35,
39
+ "d1": 36,
40
+ "d": 37,
41
+ "d2": 38,
42
+ "d3": 39,
43
+ "d4": 40,
44
+ "d5": 41,
45
+ "d6": 42,
46
+ "d7": 43,
47
+ "d8": 44,
48
+ "e1": 45,
49
+ "e": 46,
50
+ "e2": 47,
51
+ "e3": 48,
52
+ "e4": 49,
53
+ "e5": 50,
54
+ "e6": 51,
55
+ "e7": 52,
56
+ "e8": 53,
57
+ "f1": 54,
58
+ "f": 55,
59
+ "f2": 56,
60
+ "f3": 57,
61
+ "f4": 58,
62
+ "f5": 59,
63
+ "f6": 60,
64
+ "f7": 61,
65
+ "f8": 62,
66
+ "g1": 63,
67
+ "g": 64,
68
+ "g2": 65,
69
+ "g3": 66,
70
+ "g4": 67,
71
+ "g5": 68,
72
+ "g6": 69,
73
+ "g7": 70,
74
+ "g8": 71,
75
+ "h1": 72,
76
+ "h": 73,
77
+ "h2": 74,
78
+ "h3": 75,
79
+ "h4": 76,
80
+ "h5": 77,
81
+ "h6": 78,
82
+ "h7": 79,
83
+ "h8": 80,
84
+ "R": 81,
85
+ "P": 82,
86
+ "Q": 83,
87
+ "N": 84,
88
+ "K": 85,
89
+ "B": 86,
90
+ "x": 87,
91
+ ".": 88,
92
+ "O": 89,
93
+ "=": 90,
94
+ "-": 91,
95
+ "9": 92,
96
+ "0": 93,
97
+ "+": 94,
98
+ "#": 95,
99
+ "'": 96,
100
+ ",": 97,
101
+ "\"": 98,
102
+ "\t": 99,
103
+ "]": 100,
104
+ " ": 101,
105
+ ")": 102,
106
+ "\n": 103,
107
+ "(": 104,
108
+ "[": 105,
109
+ "/": 106,
110
+ "!": 107
111
+ },
112
+ "id2token": {
113
+ "0": "<PAD>",
114
+ "1": "a1",
115
+ "2": "a",
116
+ "3": "1",
117
+ "4": "a2",
118
+ "5": "2",
119
+ "6": "a3",
120
+ "7": "3",
121
+ "8": "a4",
122
+ "9": "4",
123
+ "10": "a5",
124
+ "11": "5",
125
+ "12": "a6",
126
+ "13": "6",
127
+ "14": "a7",
128
+ "15": "7",
129
+ "16": "a8",
130
+ "17": "8",
131
+ "18": "b1",
132
+ "19": "b",
133
+ "20": "b2",
134
+ "21": "b3",
135
+ "22": "b4",
136
+ "23": "b5",
137
+ "24": "b6",
138
+ "25": "b7",
139
+ "26": "b8",
140
+ "27": "c1",
141
+ "28": "c",
142
+ "29": "c2",
143
+ "30": "c3",
144
+ "31": "c4",
145
+ "32": "c5",
146
+ "33": "c6",
147
+ "34": "c7",
148
+ "35": "c8",
149
+ "36": "d1",
150
+ "37": "d",
151
+ "38": "d2",
152
+ "39": "d3",
153
+ "40": "d4",
154
+ "41": "d5",
155
+ "42": "d6",
156
+ "43": "d7",
157
+ "44": "d8",
158
+ "45": "e1",
159
+ "46": "e",
160
+ "47": "e2",
161
+ "48": "e3",
162
+ "49": "e4",
163
+ "50": "e5",
164
+ "51": "e6",
165
+ "52": "e7",
166
+ "53": "e8",
167
+ "54": "f1",
168
+ "55": "f",
169
+ "56": "f2",
170
+ "57": "f3",
171
+ "58": "f4",
172
+ "59": "f5",
173
+ "60": "f6",
174
+ "61": "f7",
175
+ "62": "f8",
176
+ "63": "g1",
177
+ "64": "g",
178
+ "65": "g2",
179
+ "66": "g3",
180
+ "67": "g4",
181
+ "68": "g5",
182
+ "69": "g6",
183
+ "70": "g7",
184
+ "71": "g8",
185
+ "72": "h1",
186
+ "73": "h",
187
+ "74": "h2",
188
+ "75": "h3",
189
+ "76": "h4",
190
+ "77": "h5",
191
+ "78": "h6",
192
+ "79": "h7",
193
+ "80": "h8",
194
+ "81": "R",
195
+ "82": "P",
196
+ "83": "Q",
197
+ "84": "N",
198
+ "85": "K",
199
+ "86": "B",
200
+ "87": "x",
201
+ "88": ".",
202
+ "89": "O",
203
+ "90": "=",
204
+ "91": "-",
205
+ "92": "9",
206
+ "93": "0",
207
+ "94": "+",
208
+ "95": "#",
209
+ "96": "'",
210
+ "97": ",",
211
+ "98": "\"",
212
+ "99": "\t",
213
+ "100": "]",
214
+ "101": " ",
215
+ "102": ")",
216
+ "103": "\n",
217
+ "104": "(",
218
+ "105": "[",
219
+ "106": "/",
220
+ "107": "!"
221
+ },
222
+ "valid_chars": [
223
+ "P",
224
+ "8",
225
+ "O",
226
+ "=",
227
+ "]",
228
+ "a",
229
+ "3",
230
+ "-",
231
+ "5",
232
+ "9",
233
+ "!",
234
+ "#",
235
+ "'",
236
+ ")",
237
+ "\n",
238
+ "(",
239
+ "6",
240
+ "N",
241
+ "B",
242
+ "/",
243
+ "2",
244
+ ".",
245
+ "+",
246
+ "b",
247
+ "0",
248
+ "h",
249
+ "1",
250
+ "[",
251
+ "g",
252
+ "7",
253
+ "f",
254
+ "R",
255
+ "x",
256
+ ",",
257
+ "\"",
258
+ "\t",
259
+ "e",
260
+ "Q",
261
+ " ",
262
+ "d",
263
+ "c",
264
+ "K",
265
+ "4"
266
+ ]
267
+ }