enpaiva commited on
Commit
de772be
·
verified ·
1 Parent(s): 8ce0c5c

Upload tokenizer

Browse files
added_tokens.json ADDED
@@ -0,0 +1,1743 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "ADA": 32206,
3
+ "Aca": 32244,
4
+ "Acto": 32970,
5
+ "Akã": 32991,
6
+ "Algu": 32306,
7
+ "Alianza": 32448,
8
+ "Alto": 33245,
9
+ "Altos": 33039,
10
+ "Ama": 33318,
11
+ "Amanda": 32484,
12
+ "Amandaje": 33389,
13
+ "Amara": 33272,
14
+ "Amazonas": 32366,
15
+ "Amo": 32755,
16
+ "América": 32927,
17
+ "Anga": 32182,
18
+ "Ange": 33024,
19
+ "Angu": 33649,
20
+ "Ani": 33620,
21
+ "Ante": 32267,
22
+ "Antillas": 32733,
23
+ "Antropología": 33408,
24
+ "Ao": 33569,
25
+ "Ape": 32556,
26
+ "Ara": 33443,
27
+ "Arandu": 33067,
28
+ "Aregua": 32763,
29
+ "Ari": 32632,
30
+ "Arque": 33058,
31
+ "Arte": 33230,
32
+ "Asunción": 32015,
33
+ "Así": 32350,
34
+ "Atlán": 33738,
35
+ "Aty": 33228,
36
+ "Atyha": 32997,
37
+ "Atyra": 32817,
38
+ "Atyrá": 33712,
39
+ "Ava": 33403,
40
+ "Avare": 32295,
41
+ "Aña": 33521,
42
+ "Bermejo": 33725,
43
+ "Bernardino": 32203,
44
+ "Bertoni": 33095,
45
+ "Bolaños": 33016,
46
+ "Bosque": 32616,
47
+ "Botánico": 32113,
48
+ "Bueno": 32978,
49
+ "Ca": 32252,
50
+ "Caazapá": 33159,
51
+ "Cabildo": 32882,
52
+ "Camino": 32211,
53
+ "Cara": 33623,
54
+ "Caribe": 33537,
55
+ "Centro": 33404,
56
+ "Cerro": 32887,
57
+ "Chu": 33312,
58
+ "Ci": 32619,
59
+ "Cic": 33297,
60
+ "Ciudad": 32610,
61
+ "Colón": 33633,
62
+ "Cordillera": 32413,
63
+ "Corrientes": 32131,
64
+ "Crea": 32456,
65
+ "Cristo": 32968,
66
+ "Cristóbal": 33195,
67
+ "Cu": 33266,
68
+ "Cuando": 33207,
69
+ "Cómo": 33437,
70
+ "Decoud": 32189,
71
+ "Departamento": 32249,
72
+ "Diana": 33560,
73
+ "Dic": 33259,
74
+ "Dil": 32831,
75
+ "Dio": 33381,
76
+ "Dios": 33594,
77
+ "Domínguez": 32172,
78
+ "Dos": 32466,
79
+ "Eloy": 32138,
80
+ "Encar": 33536,
81
+ "Enciclopedia": 33249,
82
+ "Espe": 32021,
83
+ "Espíritu": 32828,
84
+ "Estan": 32781,
85
+ "Esto": 32037,
86
+ "Estrella": 33666,
87
+ "Estudios": 32530,
88
+ "Fariña": 33273,
89
+ "Ferrocarril": 32648,
90
+ "Fla": 33431,
91
+ "Flores": 33586,
92
+ "Fra": 33380,
93
+ "Fray": 32563,
94
+ "Fro": 33188,
95
+ "Fuente": 32143,
96
+ "Ful": 33338,
97
+ "Fulgencio": 32260,
98
+ "GUA": 32705,
99
+ "Gan": 32898,
100
+ "Gra": 32639,
101
+ "Gri": 33331,
102
+ "Gua": 33127,
103
+ "Guaira": 32955,
104
+ "Guan": 32166,
105
+ "Guana": 33703,
106
+ "Guar": 33558,
107
+ "Guara": 33471,
108
+ "Guaraní": 32380,
109
+ "Guaraníes": 33115,
110
+ "Guas": 32370,
111
+ "Guasu": 33129,
112
+ "Guay": 32832,
113
+ "Guaya": 32974,
114
+ "Guevara": 33307,
115
+ "Gus": 32228,
116
+ "Guy": 33156,
117
+ "Gé": 33491,
118
+ "Habiendo": 33579,
119
+ "Hague": 32526,
120
+ "Haku": 33210,
121
+ "Hijo": 32411,
122
+ "Historia": 32419,
123
+ "Ho": 32538,
124
+ "Hova": 32680,
125
+ "Hoy": 33429,
126
+ "Hu": 32283,
127
+ "Iga": 33046,
128
+ "Ing": 33276,
129
+ "Ipa": 33131,
130
+ "Iporã": 33295,
131
+ "Ita": 33472,
132
+ "Ja": 33549,
133
+ "Jagua": 32748,
134
+ "Jaguarete": 32460,
135
+ "Jaguaru": 32613,
136
+ "Jaguaveve": 33050,
137
+ "Jaha": 33612,
138
+ "Japeusa": 32909,
139
+ "Jardín": 33359,
140
+ "Jasy": 33447,
141
+ "Jatere": 32825,
142
+ "Jesús": 32454,
143
+ "Ju": 33172,
144
+ "Jue": 32478,
145
+ "Jujuy": 33398,
146
+ "Juru": 32901,
147
+ "KU": 33728,
148
+ "Ka": 32911,
149
+ "Kai": 32674,
150
+ "Kangue": 32323,
151
+ "Kara": 32247,
152
+ "Karai": 32973,
153
+ "Kari": 32133,
154
+ "Karina": 32464,
155
+ "Karu": 33355,
156
+ "Kavaju": 32777,
157
+ "Kerana": 32682,
158
+ "Ku": 32851,
159
+ "Kuarahy": 32965,
160
+ "Kuimba": 32662,
161
+ "Kuri": 32633,
162
+ "Kurupi": 32318,
163
+ "Kuña": 32591,
164
+ "Lago": 32437,
165
+ "Lle": 33364,
166
+ "Luca": 32393,
167
+ "Lucha": 32379,
168
+ "Luna": 33541,
169
+ "Madre": 32286,
170
+ "Maestro": 33222,
171
+ "Mandu": 32470,
172
+ "Mano": 32700,
173
+ "Mapa": 33566,
174
+ "Mara": 32313,
175
+ "Marandeko": 32931,
176
+ "Marangatu": 33375,
177
+ "Marcha": 32816,
178
+ "Mari": 32071,
179
+ "Mariano": 32444,
180
+ "Marã": 33166,
181
+ "Mba": 32988,
182
+ "Mbarakaju": 32987,
183
+ "Mbe": 32592,
184
+ "Mbo": 32031,
185
+ "Mbohapy": 32518,
186
+ "Mboi": 33508,
187
+ "Mburu": 33459,
188
+ "Mburukuja": 33573,
189
+ "Mby": 32555,
190
+ "Mbya": 33600,
191
+ "Mbyja": 32860,
192
+ "Mbói": 33197,
193
+ "Mega": 33181,
194
+ "Meri": 32487,
195
+ "Moisés": 33353,
196
+ "Molas": 33112,
197
+ "Mombyr": 32235,
198
+ "Montoya": 33236,
199
+ "Moreno": 33085,
200
+ "Moñai": 33030,
201
+ "Moñái": 32446,
202
+ "Mujer": 32566,
203
+ "Mundo": 32675,
204
+ "Mur": 32250,
205
+ "Museo": 32041,
206
+ "Más": 33481,
207
+ "Naturaleza": 32703,
208
+ "Nde": 33045,
209
+ "Ndi": 33343,
210
+ "Ndo": 33718,
211
+ "Norte": 33477,
212
+ "Nos": 32885,
213
+ "Nu": 33511,
214
+ "Nuestro": 33146,
215
+ "Nuestros": 33522,
216
+ "Nueva": 33062,
217
+ "Nuevo": 32545,
218
+ "Núñez": 32765,
219
+ "Ogue": 32565,
220
+ "Oi": 32762,
221
+ "Oje": 33099,
222
+ "Opa": 32897,
223
+ "Opaite": 32369,
224
+ "Opu": 32224,
225
+ "Ora": 33009,
226
+ "Orden": 32263,
227
+ "Oriente": 32990,
228
+ "Ou": 33350,
229
+ "PARAGUAY": 32704,
230
+ "Pacífico": 32079,
231
+ "Padre": 32291,
232
+ "Para": 33187,
233
+ "Paragua": 32696,
234
+ "Paraguai": 33232,
235
+ "Paraguari": 32066,
236
+ "Paraguarí": 32293,
237
+ "Paraguay": 32326,
238
+ "Paraguá": 32221,
239
+ "Parana": 33507,
240
+ "Paraná": 33670,
241
+ "Parque": 32681,
242
+ "Patiño": 33154,
243
+ "Pau": 32201,
244
+ "Países": 32821,
245
+ "Perurima": 33401,
246
+ "Perú": 32219,
247
+ "Piedra": 33726,
248
+ "Pira": 32513,
249
+ "Pirayú": 33037,
250
+ "Pire": 32336,
251
+ "Plata": 32076,
252
+ "Población": 33258,
253
+ "Poro": 32786,
254
+ "Porã": 33315,
255
+ "Poty": 33153,
256
+ "Pozo": 32227,
257
+ "Primer": 32975,
258
+ "Primero": 32245,
259
+ "Princi": 33145,
260
+ "Provide": 32429,
261
+ "Provincia": 33715,
262
+ "Pyhare": 32810,
263
+ "Pysyrõ": 33018,
264
+ "Pyta": 32174,
265
+ "Pytã": 33668,
266
+ "Pá": 33155,
267
+ "Põ": 33528,
268
+ "Qui": 32280,
269
+ "Qué": 32749,
270
+ "Ra": 33376,
271
+ "Ras": 32240,
272
+ "Ru": 32511,
273
+ "Río": 32852,
274
+ "Salto": 33304,
275
+ "Santo": 32025,
276
+ "Sapuca": 32838,
277
+ "Semb": 33563,
278
+ "Señor": 33505,
279
+ "Sie": 33006,
280
+ "Sobre": 32495,
281
+ "Solo": 33702,
282
+ "Soy": 32759,
283
+ "Supremo": 32572,
284
+ "Sí": 32758,
285
+ "TU": 33581,
286
+ "Ta": 32073,
287
+ "Tamandua": 32963,
288
+ "Tatu": 33068,
289
+ "Tava": 32074,
290
+ "Tavapy": 32452,
291
+ "Teju": 33287,
292
+ "Tenonde": 32496,
293
+ "Tere": 32069,
294
+ "Tetã": 33635,
295
+ "Ti": 33368,
296
+ "Todo": 33578,
297
+ "Todos": 33126,
298
+ "Tome": 33397,
299
+ "Tomás": 33526,
300
+ "Tomé": 32752,
301
+ "Tras": 33229,
302
+ "Tres": 33025,
303
+ "Triple": 32848,
304
+ "Tru": 33308,
305
+ "Tu": 32390,
306
+ "Tupa": 33433,
307
+ "Tupi": 32124,
308
+ "Tupã": 32442,
309
+ "Tupí": 33160,
310
+ "Tus": 32104,
311
+ "Tú": 32579,
312
+ "Túva": 33539,
313
+ "Umi": 32715,
314
+ "Uni": 33577,
315
+ "Uno": 32958,
316
+ "Upe": 32072,
317
+ "Upépe": 33208,
318
+ "Uru": 33710,
319
+ "Va": 33075,
320
+ "Venus": 33167,
321
+ "Vera": 32595,
322
+ "Ves": 32465,
323
+ "Vida": 32527,
324
+ "Vie": 32186,
325
+ "Villarica": 32678,
326
+ "Vir": 32818,
327
+ "Ví": 33518,
328
+ "XXI": 33319,
329
+ "XXIII": 32667,
330
+ "Ya": 33280,
331
+ "Yaguarón": 33514,
332
+ "Ye": 32359,
333
+ "Yga": 32048,
334
+ "Ygarata": 33588,
335
+ "Ykua": 33440,
336
+ "Yo": 33191,
337
+ "Ypa": 33179,
338
+ "Ypacaraí": 32447,
339
+ "Ypakarai": 33681,
340
+ "Ypy": 33722,
341
+ "Yu": 32110,
342
+ "Yucatán": 33394,
343
+ "Yvy": 32476,
344
+ "Yvyra": 32622,
345
+ "Yvyty": 32774,
346
+ "Yvytyrusu": 32493,
347
+ "abando": 32261,
348
+ "abo": 33484,
349
+ "abu": 32567,
350
+ "acción": 33532,
351
+ "aceite": 33663,
352
+ "acor": 33571,
353
+ "actividades": 32070,
354
+ "acto": 32305,
355
+ "acu": 32986,
356
+ "acuerdo": 32692,
357
+ "además": 33420,
358
+ "afluente": 33120,
359
+ "agua": 32480,
360
+ "agui": 33572,
361
+ "aguy": 32574,
362
+ "aháta": 33199,
363
+ "albo": 32434,
364
+ "alcan": 33409,
365
+ "algo": 32294,
366
+ "alma": 32548,
367
+ "alta": 32175,
368
+ "altura": 33310,
369
+ "amante": 32690,
370
+ "amarillo": 33609,
371
+ "ambiente": 32711,
372
+ "ambu": 32371,
373
+ "americana": 32744,
374
+ "americano": 32463,
375
+ "amoite": 33051,
376
+ "amor": 33007,
377
+ "angaipa": 32841,
378
+ "angy": 32194,
379
+ "anima": 33032,
380
+ "animales": 32289,
381
+ "antiguo": 32796,
382
+ "antropólogo": 32129,
383
+ "anía": 32971,
384
+ "apo": 33625,
385
+ "apro": 32685,
386
+ "apu": 32338,
387
+ "arandu": 32005,
388
+ "arasa": 32000,
389
+ "arasy": 33023,
390
+ "arma": 33177,
391
+ "armada": 33168,
392
+ "armonía": 33233,
393
+ "arro": 33078,
394
+ "arroyo": 33378,
395
+ "artí": 32593,
396
+ "artículo": 32872,
397
+ "ará": 32332,
398
+ "aré": 32769,
399
+ "asamblea": 32185,
400
+ "asesi": 33485,
401
+ "atribu": 32386,
402
+ "audi": 32540,
403
+ "aurora": 33327,
404
+ "avare": 32086,
405
+ "avati": 32499,
406
+ "avei": 33227,
407
+ "aventura": 32334,
408
+ "azul": 33238,
409
+ "año": 32377,
410
+ "bado": 32504,
411
+ "baja": 32676,
412
+ "bala": 33184,
413
+ "batal": 32886,
414
+ "batalla": 33597,
415
+ "baté": 32187,
416
+ "bella": 32312,
417
+ "bera": 32629,
418
+ "beza": 33584,
419
+ "biendo": 33323,
420
+ "bildo": 32999,
421
+ "bilidad": 33250,
422
+ "bios": 32642,
423
+ "bió": 33545,
424
+ "blanca": 32190,
425
+ "blanco": 33645,
426
+ "bora": 32732,
427
+ "borada": 33463,
428
+ "bosque": 32067,
429
+ "bri": 33660,
430
+ "bulo": 32423,
431
+ "bá": 32266,
432
+ "caba": 32352,
433
+ "cada": 32396,
434
+ "cado": 33622,
435
+ "cados": 33548,
436
+ "calles": 32035,
437
+ "cambio": 32646,
438
+ "campana": 33665,
439
+ "cana": 32569,
440
+ "cano": 32165,
441
+ "cante": 32689,
442
+ "canto": 33340,
443
+ "cara": 32771,
444
+ "caracteres": 32977,
445
+ "característica": 32406,
446
+ "carbón": 32008,
447
+ "carne": 32455,
448
+ "cartera": 33047,
449
+ "cau": 32716,
450
+ "cedo": 32115,
451
+ "cementerio": 33034,
452
+ "cena": 32135,
453
+ "cente": 33732,
454
+ "centes": 32888,
455
+ "cepción": 32506,
456
+ "ceremonia": 33575,
457
+ "ceres": 33674,
458
+ "cerro": 32197,
459
+ "cerámica": 32192,
460
+ "ceso": 32451,
461
+ "chas": 32787,
462
+ "chehegui": 32321,
463
+ "chipa": 33373,
464
+ "chive": 33231,
465
+ "chu": 33733,
466
+ "chávo": 32967,
467
+ "chó": 33385,
468
+ "cic": 32215,
469
+ "cida": 33469,
470
+ "cielo": 33400,
471
+ "cien": 32924,
472
+ "ciencia": 32835,
473
+ "científico": 32920,
474
+ "cillo": 32899,
475
+ "cimiento": 33223,
476
+ "cimientos": 32126,
477
+ "cinco": 33352,
478
+ "cine": 32515,
479
+ "cinemato": 32368,
480
+ "cion": 33556,
481
+ "ciona": 32141,
482
+ "ciones": 33673,
483
+ "cios": 33686,
484
+ "circu": 32877,
485
+ "cismo": 32080,
486
+ "cito": 32100,
487
+ "civilización": 32655,
488
+ "cla": 32604,
489
+ "clás": 33590,
490
+ "coco": 32649,
491
+ "colec": 32584,
492
+ "combate": 32550,
493
+ "combi": 32640,
494
+ "comer": 33454,
495
+ "comi": 32727,
496
+ "comisión": 32237,
497
+ "compa": 33730,
498
+ "compañero": 32938,
499
+ "compañía": 32044,
500
+ "comple": 33336,
501
+ "completa": 33019,
502
+ "composición": 33103,
503
+ "compositor": 32608,
504
+ "compu": 32908,
505
+ "comu": 32844,
506
+ "comunicación": 33135,
507
+ "común": 33519,
508
+ "conciencia": 33509,
509
+ "concierto": 32373,
510
+ "concurso": 33462,
511
+ "condición": 33455,
512
+ "congo": 32854,
513
+ "conjunto": 32585,
514
+ "cono": 33492,
515
+ "conoce": 32159,
516
+ "conocido": 33384,
517
+ "conocimiento": 33534,
518
+ "conquista": 32307,
519
+ "conse": 32785,
520
+ "conserva": 33474,
521
+ "conservación": 33235,
522
+ "consorte": 32403,
523
+ "constitu": 33142,
524
+ "construcción": 32811,
525
+ "consu": 33596,
526
+ "conta": 32691,
527
+ "contacto": 33720,
528
+ "conte": 33176,
529
+ "continente": 33619,
530
+ "contra": 32275,
531
+ "convierte": 32856,
532
+ "corazón": 33022,
533
+ "cordia": 32212,
534
+ "cordillera": 33057,
535
+ "coro": 32605,
536
+ "corriente": 32549,
537
+ "corro": 33225,
538
+ "cosa": 33052,
539
+ "cosas": 33214,
540
+ "costa": 32889,
541
+ "costu": 32010,
542
+ "cra": 33494,
543
+ "crea": 32220,
544
+ "creado": 32929,
545
+ "creó": 32688,
546
+ "cripción": 33464,
547
+ "cristiano": 32178,
548
+ "cristianos": 33442,
549
+ "cru": 32557,
550
+ "crí": 33611,
551
+ "cti": 32822,
552
+ "ctiva": 32568,
553
+ "ctora": 32637,
554
+ "ctrina": 33060,
555
+ "cua": 33163,
556
+ "cuadro": 32753,
557
+ "cubri": 33289,
558
+ "cuencia": 33677,
559
+ "cuenta": 32660,
560
+ "cuentos": 33653,
561
+ "cuer": 32356,
562
+ "cuerdo": 32158,
563
+ "cuerdos": 32551,
564
+ "cuerpo": 32754,
565
+ "culas": 32494,
566
+ "culo": 33638,
567
+ "culos": 33424,
568
+ "cultad": 32296,
569
+ "cunda": 33237,
570
+ "cura": 32068,
571
+ "cá": 32790,
572
+ "célebre": 32231,
573
+ "cía": 33411,
574
+ "có": 33347,
575
+ "cómico": 33457,
576
+ "cú": 33707,
577
+ "dad": 32673,
578
+ "dades": 32895,
579
+ "dado": 32921,
580
+ "danza": 33044,
581
+ "datos": 32443,
582
+ "defensa": 32363,
583
+ "dele": 32039,
584
+ "dente": 32812,
585
+ "dentes": 33374,
586
+ "dentro": 32407,
587
+ "departamento": 32855,
588
+ "dera": 33527,
589
+ "deras": 33700,
590
+ "dero": 33226,
591
+ "deros": 32019,
592
+ "derro": 32253,
593
+ "desa": 32594,
594
+ "desarrollo": 33065,
595
+ "descono": 32389,
596
+ "descubri": 33360,
597
+ "desen": 33008,
598
+ "deseo": 32775,
599
+ "desi": 33180,
600
+ "destino": 32804,
601
+ "diantes": 32712,
602
+ "dibu": 32213,
603
+ "dic": 33371,
604
+ "dica": 32449,
605
+ "diccionario": 32770,
606
+ "dida": 33608,
607
+ "digo": 32134,
608
+ "dijo": 33388,
609
+ "dil": 32564,
610
+ "dilla": 32223,
611
+ "dio": 33079,
612
+ "dional": 32793,
613
+ "dios": 32188,
614
+ "dirección": 33140,
615
+ "dita": 32502,
616
+ "dito": 33714,
617
+ "divinidad": 32137,
618
+ "dobla": 32160,
619
+ "dor": 32092,
620
+ "dorado": 33618,
621
+ "dores": 33607,
622
+ "dos": 33616,
623
+ "drón": 32718,
624
+ "ducciones": 32030,
625
+ "ducción": 32196,
626
+ "dulce": 32543,
627
+ "dura": 32385,
628
+ "duría": 32144,
629
+ "dé": 33284,
630
+ "día": 32730,
631
+ "días": 32164,
632
+ "dó": 33196,
633
+ "dón": 32789,
634
+ "eco": 32893,
635
+ "ecos": 33693,
636
+ "efecto": 33737,
637
+ "eha": 33290,
638
+ "ejecu": 32864,
639
+ "ejército": 32094,
640
+ "electricidad": 32002,
641
+ "elemento": 33603,
642
+ "eléct": 32576,
643
+ "eléctrica": 32378,
644
+ "embo": 32553,
645
+ "emo": 32018,
646
+ "empre": 32098,
647
+ "empresa": 33626,
648
+ "encio": 32195,
649
+ "enemigo": 32410,
650
+ "energía": 33383,
651
+ "enfer": 33705,
652
+ "enos": 32329,
653
+ "ensayos": 32038,
654
+ "enseñanza": 32946,
655
+ "entero": 32795,
656
+ "entos": 32310,
657
+ "equi": 32922,
658
+ "erras": 33015,
659
+ "errero": 33444,
660
+ "erte": 32618,
661
+ "ertos": 32587,
662
+ "ervo": 33193,
663
+ "esca": 32001,
664
+ "escena": 32687,
665
+ "escenario": 33084,
666
+ "esco": 33562,
667
+ "escri": 32653,
668
+ "escribi": 32415,
669
+ "escul": 32916,
670
+ "escultura": 32348,
671
+ "esia": 33165,
672
+ "esión": 32418,
673
+ "espa": 32401,
674
+ "espacio": 33395,
675
+ "español": 32204,
676
+ "espe": 32042,
677
+ "especie": 32834,
678
+ "especies": 32959,
679
+ "espectáculo": 32128,
680
+ "esperanza": 32397,
681
+ "espiritual": 32517,
682
+ "espo": 32657,
683
+ "esposa": 32699,
684
+ "espíritu": 33252,
685
+ "estable": 32645,
686
+ "estación": 33038,
687
+ "estas": 33234,
688
+ "esti": 33425,
689
+ "estilo": 32400,
690
+ "estos": 32983,
691
+ "estre": 32706,
692
+ "estros": 32580,
693
+ "estu": 32724,
694
+ "estudio": 33148,
695
+ "está": 32222,
696
+ "etnólogo": 33530,
697
+ "explo": 33592,
698
+ "extensión": 32525,
699
+ "extran": 33487,
700
+ "extranjero": 33055,
701
+ "eño": 33595,
702
+ "fal": 33667,
703
+ "familia": 33342,
704
+ "famoso": 32391,
705
+ "fano": 32118,
706
+ "fante": 32132,
707
+ "fauna": 32701,
708
+ "fec": 32457,
709
+ "fecta": 33301,
710
+ "fecto": 33014,
711
+ "feliz": 33500,
712
+ "ferencia": 32381,
713
+ "fia": 32314,
714
+ "fici": 33098,
715
+ "fiesta": 32904,
716
+ "figura": 32243,
717
+ "firma": 32102,
718
+ "flauta": 33489,
719
+ "fle": 32387,
720
+ "flo": 33396,
721
+ "flor": 33333,
722
+ "folklore": 32779,
723
+ "fondo": 33326,
724
+ "fra": 33090,
725
+ "francés": 33567,
726
+ "frente": 32273,
727
+ "fru": 33109,
728
+ "frutilla": 33020,
729
+ "fuego": 33689,
730
+ "fuente": 32046,
731
+ "fuer": 32766,
732
+ "fuera": 33615,
733
+ "fuerte": 32745,
734
+ "fuerza": 32919,
735
+ "fuerzas": 32151,
736
+ "funcio": 33351,
737
+ "funda": 32319,
738
+ "fusil": 32065,
739
+ "fusión": 33324,
740
+ "futuro": 32913,
741
+ "fá": 32697,
742
+ "física": 32149,
743
+ "físico": 32101,
744
+ "fón": 33029,
745
+ "gada": 32507,
746
+ "gado": 33639,
747
+ "gante": 33565,
748
+ "garra": 32596,
749
+ "gaz": 33605,
750
+ "gaña": 33683,
751
+ "generación": 33123,
752
+ "genes": 32947,
753
+ "gente": 32837,
754
+ "geográficas": 33407,
755
+ "gico": 32347,
756
+ "gido": 32892,
757
+ "gistra": 32202,
758
+ "gli": 33139,
759
+ "glo": 32784,
760
+ "gloria": 33117,
761
+ "gna": 32114,
762
+ "gol": 33448,
763
+ "graba": 33311,
764
+ "grabado": 33122,
765
+ "grada": 33303,
766
+ "grado": 32957,
767
+ "grafía": 33035,
768
+ "grafías": 33107,
769
+ "greso": 32264,
770
+ "gri": 33740,
771
+ "griega": 33687,
772
+ "grá": 33097,
773
+ "gráfica": 32823,
774
+ "gráficas": 33100,
775
+ "gría": 32739,
776
+ "gua": 32417,
777
+ "guara": 32652,
778
+ "guarani": 33027,
779
+ "guaraní": 33432,
780
+ "guaraníes": 33552,
781
+ "guardia": 32009,
782
+ "guare": 32532,
783
+ "guari": 32399,
784
+ "guas": 33093,
785
+ "guasu": 33449,
786
+ "guata": 32912,
787
+ "guer": 32171,
788
+ "guera": 33288,
789
+ "guio": 33004,
790
+ "guitar": 32150,
791
+ "guitarra": 32842,
792
+ "gura": 33091,
793
+ "guy": 32698,
794
+ "guyra": 32813,
795
+ "guá": 32325,
796
+ "guáme": 33077,
797
+ "guára": 33111,
798
+ "guã": 33503,
799
+ "gué": 33587,
800
+ "gánica": 32788,
801
+ "gé": 32857,
802
+ "género": 32013,
803
+ "gó": 32980,
804
+ "gũ": 33102,
805
+ "gũe": 33317,
806
+ "habl": 33445,
807
+ "habla": 32794,
808
+ "hacer": 33221,
809
+ "hague": 32858,
810
+ "haguã": 33478,
811
+ "haguépe": 33043,
812
+ "haku": 32279,
813
+ "hasýpe": 33512,
814
+ "hay": 32365,
815
+ "hecha": 32925,
816
+ "hechávo": 32052,
817
+ "henda": 32308,
818
+ "hendive": 32229,
819
+ "hermano": 33482,
820
+ "hesa": 32242,
821
+ "hetyma": 33493,
822
+ "hierro": 33678,
823
+ "hija": 33356,
824
+ "hijo": 33427,
825
+ "hijos": 33345,
826
+ "hispano": 33547,
827
+ "historia": 33392,
828
+ "histórica": 32136,
829
+ "hizo": 32236,
830
+ "hogue": 32430,
831
+ "hojas": 32713,
832
+ "hombre": 32474,
833
+ "homenaje": 32322,
834
+ "hory": 32488,
835
+ "hoy": 33661,
836
+ "humana": 33629,
837
+ "humano": 33379,
838
+ "humanos": 32011,
839
+ "humo": 32233,
840
+ "hymba": 33643,
841
+ "há": 32625,
842
+ "hápe": 33071,
843
+ "hú": 33589,
844
+ "icadores": 32176,
845
+ "icción": 33216,
846
+ "icha": 32969,
847
+ "icho": 32177,
848
+ "ichu": 33719,
849
+ "icias": 33711,
850
+ "idioma": 32106,
851
+ "ielo": 33329,
852
+ "ikua": 33582,
853
+ "ikuaa": 32923,
854
+ "ilus": 32535,
855
+ "ilustres": 33277,
856
+ "imba": 32342,
857
+ "impe": 32316,
858
+ "imposible": 33467,
859
+ "impres": 32439,
860
+ "imágenes": 32427,
861
+ "indio": 32362,
862
+ "indígena": 32420,
863
+ "indígenas": 32528,
864
+ "infierno": 32799,
865
+ "influencia": 33479,
866
+ "ingenio": 33278,
867
+ "inglesa": 32292,
868
+ "inmigra": 32905,
869
+ "inspiración": 32433,
870
+ "instituciones": 32344,
871
+ "instru": 32230,
872
+ "instrucción": 32367,
873
+ "interpre": 32303,
874
+ "inva": 32458,
875
+ "invasión": 33627,
876
+ "inve": 33650,
877
+ "inventor": 32477,
878
+ "investigación": 32736,
879
+ "ipo": 32524,
880
+ "iporãva": 32861,
881
+ "irã": 32490,
882
+ "isla": 33614,
883
+ "islas": 32304,
884
+ "itaty": 33436,
885
+ "ivéva": 33694,
886
+ "jagua": 32870,
887
+ "jahe": 32792,
888
+ "jai": 33658,
889
+ "jaikuaa": 33017,
890
+ "jana": 32416,
891
+ "jano": 32146,
892
+ "jante": 32023,
893
+ "jara": 32979,
894
+ "jaro": 32147,
895
+ "jase": 32374,
896
+ "jasy": 32281,
897
+ "jatere": 33413,
898
+ "jave": 32768,
899
+ "jeha": 33515,
900
+ "jepe": 32807,
901
+ "jera": 32962,
902
+ "jere": 33636,
903
+ "jero": 33382,
904
+ "jesareko": 32972,
905
+ "jesuita": 33417,
906
+ "jinete": 32746,
907
+ "joguaha": 32017,
908
+ "jovái": 33178,
909
+ "juhu": 33662,
910
+ "juicio": 32087,
911
+ "juka": 32992,
912
+ "juru": 32226,
913
+ "juventud": 33000,
914
+ "já": 32453,
915
+ "jára": 32928,
916
+ "jó": 32960,
917
+ "jón": 33695,
918
+ "jú": 33081,
919
+ "júi": 33657,
920
+ "kapa": 32767,
921
+ "karai": 32826,
922
+ "karaja": 33470,
923
+ "karu": 33495,
924
+ "karumbe": 32862,
925
+ "kañy": 33682,
926
+ "kena": 33101,
927
+ "koty": 33063,
928
+ "kua": 32205,
929
+ "kuarahy": 32007,
930
+ "kuarepoti": 33604,
931
+ "kuatia": 33247,
932
+ "kue": 33147,
933
+ "kuimba": 32827,
934
+ "kuja": 33439,
935
+ "kuru": 33042,
936
+ "kuá": 32486,
937
+ "kuã": 32116,
938
+ "kuéra": 33088,
939
+ "kuére": 32006,
940
+ "kuña": 33286,
941
+ "kyra": 32607,
942
+ "ká": 33483,
943
+ "káva": 32665,
944
+ "kã": 32764,
945
+ "kó": 32078,
946
+ "kói": 32170,
947
+ "lado": 32333,
948
+ "lago": 32606,
949
+ "lama": 32976,
950
+ "lanza": 33399,
951
+ "lares": 32168,
952
+ "larga": 32107,
953
+ "larios": 33461,
954
+ "lau": 33066,
955
+ "lava": 32207,
956
+ "lea": 33540,
957
+ "leche": 32998,
958
+ "lena": 33348,
959
+ "lengua": 33410,
960
+ "lenguaje": 33157,
961
+ "lenguas": 33366,
962
+ "leo": 33076,
963
+ "lera": 32045,
964
+ "lesa": 32059,
965
+ "leta": 32590,
966
+ "leto": 33254,
967
+ "letra": 32467,
968
+ "leza": 32258,
969
+ "libra": 32208,
970
+ "libros": 33189,
971
+ "licas": 33150,
972
+ "lico": 33194,
973
+ "lidad": 33201,
974
+ "ligencia": 33724,
975
+ "litas": 32414,
976
+ "lito": 32248,
977
+ "liz": 32058,
978
+ "liza": 32285,
979
+ "lión": 33242,
980
+ "llamado": 32726,
981
+ "llas": 32948,
982
+ "llegar": 32666,
983
+ "llo": 33332,
984
+ "llos": 33339,
985
+ "lluvia": 33630,
986
+ "lobo": 33299,
987
+ "loca": 33602,
988
+ "locausto": 33241,
989
+ "loco": 32331,
990
+ "londrina": 33321,
991
+ "lores": 32725,
992
+ "loso": 32218,
993
+ "lta": 33497,
994
+ "lucero": 32669,
995
+ "lucha": 33402,
996
+ "luna": 32315,
997
+ "luvia": 32907,
998
+ "luz": 33344,
999
+ "lá": 32720,
1000
+ "lí": 32656,
1001
+ "ló": 32122,
1002
+ "lógica": 32740,
1003
+ "lógico": 32276,
1004
+ "lógicos": 32964,
1005
+ "lón": 33256,
1006
+ "mada": 32734,
1007
+ "maderas": 32274,
1008
+ "maestro": 32409,
1009
+ "magna": 33263,
1010
+ "mala": 32082,
1011
+ "manda": 33096,
1012
+ "mando": 32670,
1013
+ "mane": 32284,
1014
+ "manga": 33564,
1015
+ "mano": 32270,
1016
+ "mante": 32559,
1017
+ "manterei": 32824,
1018
+ "mara": 32398,
1019
+ "marandeko": 33105,
1020
+ "marca": 33709,
1021
+ "marcha": 32154,
1022
+ "marino": 33412,
1023
+ "masa": 32354,
1024
+ "mata": 33215,
1025
+ "matemático": 32121,
1026
+ "matrimonio": 32097,
1027
+ "mba": 32193,
1028
+ "mbaja": 32539,
1029
+ "mbata": 32277,
1030
+ "mbe": 32384,
1031
+ "mberu": 32903,
1032
+ "mbi": 33134,
1033
+ "mbito": 33591,
1034
+ "mbo": 33634,
1035
+ "mbohapy": 32034,
1036
+ "mbolo": 32056,
1037
+ "mborevi": 32040,
1038
+ "mbos": 32508,
1039
+ "mbra": 33325,
1040
+ "mbres": 33405,
1041
+ "mbro": 32820,
1042
+ "mburu": 33244,
1043
+ "mby": 32562,
1044
+ "mbyja": 32217,
1045
+ "mbytépe": 33434,
1046
+ "mbáy": 32184,
1047
+ "mbó": 32259,
1048
+ "mbói": 33415,
1049
+ "meda": 32145,
1050
+ "medicina": 32731,
1051
+ "medida": 32421,
1052
+ "medio": 33300,
1053
+ "memoria": 33610,
1054
+ "menda": 32445,
1055
+ "mensa": 32327,
1056
+ "menta": 32839,
1057
+ "mental": 32772,
1058
+ "mento": 32533,
1059
+ "mentos": 32597,
1060
+ "mera": 32853,
1061
+ "metros": 33171,
1062
+ "miarirõ": 32311,
1063
+ "mico": 32309,
1064
+ "mie": 32256,
1065
+ "miel": 33646,
1066
+ "miembro": 33701,
1067
+ "miembros": 32103,
1068
+ "miento": 33257,
1069
+ "mientos": 33330,
1070
+ "mila": 33496,
1071
+ "mimbi": 33116,
1072
+ "mimby": 32358,
1073
+ "miniatura": 33108,
1074
+ "ministra": 32426,
1075
+ "mino": 33706,
1076
+ "miri": 32500,
1077
+ "misión": 32063,
1078
+ "misterio": 32360,
1079
+ "mita": 33036,
1080
+ "mitología": 32440,
1081
+ "mitã": 32943,
1082
+ "modelo": 32529,
1083
+ "momarandu": 32481,
1084
+ "mombe": 33094,
1085
+ "mones": 32985,
1086
+ "mono": 33274,
1087
+ "monta": 32485,
1088
+ "monte": 32268,
1089
+ "monumento": 32808,
1090
+ "mora": 32239,
1091
+ "mosa": 32840,
1092
+ "moso": 33501,
1093
+ "motivo": 33387,
1094
+ "movimiento": 32473,
1095
+ "mpa": 33731,
1096
+ "mpe": 32756,
1097
+ "mpia": 32096,
1098
+ "mpre": 32029,
1099
+ "mucho": 32644,
1100
+ "mudo": 32123,
1101
+ "mue": 32836,
1102
+ "muerte": 32272,
1103
+ "mujer": 32257,
1104
+ "mula": 32382,
1105
+ "má": 32961,
1106
+ "mán": 32317,
1107
+ "mánt": 33559,
1108
+ "mántica": 32083,
1109
+ "már": 32402,
1110
+ "mático": 33708,
1111
+ "mã": 33624,
1112
+ "mí": 32902,
1113
+ "mínima": 32995,
1114
+ "míva": 33205,
1115
+ "mó": 32482,
1116
+ "músicos": 32641,
1117
+ "nacido": 32791,
1118
+ "nacimiento": 32521,
1119
+ "nación": 33617,
1120
+ "nada": 32949,
1121
+ "nadadora": 32630,
1122
+ "nado": 32956,
1123
+ "naga": 33692,
1124
+ "nales": 32939,
1125
+ "namba": 32751,
1126
+ "naranja": 33466,
1127
+ "nario": 33328,
1128
+ "nasal": 32728,
1129
+ "nato": 33056,
1130
+ "natura": 32181,
1131
+ "naturaleza": 32890,
1132
+ "nauta": 33320,
1133
+ "nave": 33632,
1134
+ "navegación": 33486,
1135
+ "navegante": 33198,
1136
+ "nca": 33361,
1137
+ "ncio": 32778,
1138
+ "nción": 32900,
1139
+ "ncla": 33659,
1140
+ "nco": 33369,
1141
+ "nda": 32609,
1142
+ "ndas": 32441,
1143
+ "ndes": 33727,
1144
+ "ndi": 33685,
1145
+ "ndice": 33169,
1146
+ "ndida": 33213,
1147
+ "ndido": 33723,
1148
+ "ndie": 32541,
1149
+ "ndo": 32809,
1150
+ "ndy": 32297,
1151
+ "negra": 32869,
1152
+ "negro": 33553,
1153
+ "nera": 32876,
1154
+ "nesis": 32085,
1155
+ "nga": 33655,
1156
+ "ngo": 32560,
1157
+ "ngue": 32179,
1158
+ "ngusu": 33365,
1159
+ "nguéra": 33538,
1160
+ "nicación": 32337,
1161
+ "nimia": 32843,
1162
+ "nimo": 32120,
1163
+ "nita": 33652,
1164
+ "niño": 32598,
1165
+ "niños": 32450,
1166
+ "noche": 32183,
1167
+ "noches": 33386,
1168
+ "nombre": 32695,
1169
+ "nombres": 32601,
1170
+ "nome": 32945,
1171
+ "nota": 33717,
1172
+ "nove": 33011,
1173
+ "nst": 33648,
1174
+ "nta": 32036,
1175
+ "ntes": 33251,
1176
+ "ntico": 33341,
1177
+ "ntos": 33183,
1178
+ "nuestra": 32600,
1179
+ "nuestro": 32225,
1180
+ "nunca": 33001,
1181
+ "nálisis": 32941,
1182
+ "nía": 33121,
1183
+ "nín": 32984,
1184
+ "nó": 32635,
1185
+ "obispo": 32735,
1186
+ "obras": 33260,
1187
+ "observa": 32424,
1188
+ "ocul": 32119,
1189
+ "oike": 32915,
1190
+ "oja": 33282,
1191
+ "oje": 32278,
1192
+ "ojehúva": 32845,
1193
+ "ológico": 32542,
1194
+ "opo": 32238,
1195
+ "opupu": 32491,
1196
+ "ordina": 33133,
1197
+ "origen": 32659,
1198
+ "origina": 32615,
1199
+ "orquesta": 33204,
1200
+ "orquí": 33040,
1201
+ "ortografía": 32210,
1202
+ "otro": 32471,
1203
+ "oxígeno": 33291,
1204
+ "oye": 32738,
1205
+ "oñe": 32588,
1206
+ "oúva": 32061,
1207
+ "paci": 32469,
1208
+ "padres": 32944,
1209
+ "pahague": 32012,
1210
+ "paisa": 33086,
1211
+ "paisaje": 33220,
1212
+ "paja": 32364,
1213
+ "paje": 33033,
1214
+ "pala": 32910,
1215
+ "palabra": 32694,
1216
+ "palabras": 33082,
1217
+ "pane": 33192,
1218
+ "pano": 33053,
1219
+ "papel": 32498,
1220
+ "paragua": 33453,
1221
+ "paraíso": 33296,
1222
+ "partí": 32435,
1223
+ "pasa": 32335,
1224
+ "pasado": 32081,
1225
+ "pasión": 32436,
1226
+ "patria": 33690,
1227
+ "patrono": 32558,
1228
+ "pav": 32561,
1229
+ "pavo": 32578,
1230
+ "paz": 32020,
1231
+ "pea": 33370,
1232
+ "peguá": 33510,
1233
+ "pei": 33089,
1234
+ "peligro": 33555,
1235
+ "pena": 33087,
1236
+ "pende": 33671,
1237
+ "pensa": 32412,
1238
+ "pequeña": 32850,
1239
+ "pera": 33164,
1240
+ "peración": 33418,
1241
+ "pere": 32783,
1242
+ "permanente": 32523,
1243
+ "perros": 32055,
1244
+ "perse": 32621,
1245
+ "persona": 33406,
1246
+ "personaje": 32432,
1247
+ "período": 33144,
1248
+ "pesca": 33525,
1249
+ "peso": 32209,
1250
+ "petróleo": 33535,
1251
+ "peve": 32408,
1252
+ "pico": 32501,
1253
+ "pido": 32684,
1254
+ "piedra": 32937,
1255
+ "pies": 32896,
1256
+ "pios": 33568,
1257
+ "pir": 32627,
1258
+ "piración": 32468,
1259
+ "piro": 32891,
1260
+ "pla": 33631,
1261
+ "planta": 33175,
1262
+ "plantas": 33451,
1263
+ "plata": 32722,
1264
+ "playa": 33170,
1265
+ "pobre": 32290,
1266
+ "pochy": 33517,
1267
+ "poli": 32324,
1268
+ "populares": 33190,
1269
+ "pore": 32026,
1270
+ "poro": 32438,
1271
+ "portuguesa": 33593,
1272
+ "portugués": 33524,
1273
+ "poru": 32064,
1274
+ "posi": 32505,
1275
+ "posición": 32492,
1276
+ "pozo": 33551,
1277
+ "pra": 33456,
1278
+ "prehis": 32057,
1279
+ "presente": 33104,
1280
+ "presión": 32830,
1281
+ "primario": 32894,
1282
+ "primero": 33570,
1283
+ "primi": 32343,
1284
+ "pris": 32803,
1285
+ "proceso": 32702,
1286
+ "profunda": 32552,
1287
+ "promo": 32497,
1288
+ "propia": 33316,
1289
+ "propio": 32246,
1290
+ "prueba": 32341,
1291
+ "práctica": 33239,
1292
+ "pró": 32865,
1293
+ "publicado": 33005,
1294
+ "pueblo": 32612,
1295
+ "pueblos": 33118,
1296
+ "puesta": 33271,
1297
+ "puesto": 33468,
1298
+ "pukái": 33130,
1299
+ "pula": 32650,
1300
+ "pura": 32049,
1301
+ "puro": 32214,
1302
+ "puru": 33137,
1303
+ "puso": 33688,
1304
+ "pyry": 32760,
1305
+ "pysyrõ": 33354,
1306
+ "pyt": 32537,
1307
+ "pytu": 33069,
1308
+ "pá": 33426,
1309
+ "pág": 33346,
1310
+ "pã": 33490,
1311
+ "pé": 32051,
1312
+ "pér": 33574,
1313
+ "pí": 33460,
1314
+ "pó": 33110,
1315
+ "pón": 32729,
1316
+ "pópe": 32003,
1317
+ "póra": 32004,
1318
+ "pú": 32875,
1319
+ "pública": 32531,
1320
+ "público": 32952,
1321
+ "púre": 32479,
1322
+ "queda": 33367,
1323
+ "queta": 32966,
1324
+ "qui": 32679,
1325
+ "quie": 33217,
1326
+ "quiero": 32509,
1327
+ "quilla": 33267,
1328
+ "quito": 32884,
1329
+ "ración": 33654,
1330
+ "rada": 32683,
1331
+ "rado": 32798,
1332
+ "rador": 32934,
1333
+ "radores": 33544,
1334
+ "rae": 33647,
1335
+ "raha": 33113,
1336
+ "raita": 33262,
1337
+ "raldo": 32582,
1338
+ "rama": 33294,
1339
+ "rana": 32626,
1340
+ "ranza": 33542,
1341
+ "rasy": 32075,
1342
+ "rata": 33013,
1343
+ "raza": 33269,
1344
+ "razón": 33240,
1345
+ "rda": 32936,
1346
+ "realidad": 33716,
1347
+ "reas": 32982,
1348
+ "recha": 32117,
1349
+ "reco": 32302,
1350
+ "recursos": 33691,
1351
+ "rede": 32677,
1352
+ "refugio": 33270,
1353
+ "región": 32797,
1354
+ "reina": 32647,
1355
+ "reindy": 33423,
1356
+ "reino": 32589,
1357
+ "rejo": 32084,
1358
+ "reju": 32241,
1359
+ "reka": 33152,
1360
+ "reko": 33391,
1361
+ "rela": 32251,
1362
+ "religión": 32199,
1363
+ "rembe": 33520,
1364
+ "rembo": 32142,
1365
+ "remi": 32301,
1366
+ "remo": 32914,
1367
+ "rencia": 32282,
1368
+ "rendápe": 32191,
1369
+ "renta": 32846,
1370
+ "reper": 32536,
1371
+ "repertorio": 32216,
1372
+ "represa": 32053,
1373
+ "repu": 32743,
1374
+ "reside": 32554,
1375
+ "resión": 33358,
1376
+ "respe": 32299,
1377
+ "respira": 33640,
1378
+ "reta": 33672,
1379
+ "rete": 33132,
1380
+ "ricas": 32339,
1381
+ "riente": 32090,
1382
+ "rientes": 33185,
1383
+ "rigua": 32200,
1384
+ "rilla": 32095,
1385
+ "rina": 32345,
1386
+ "riores": 33138,
1387
+ "rió": 32050,
1388
+ "rlo": 33334,
1389
+ "roga": 32544,
1390
+ "rojo": 33390,
1391
+ "ronco": 33200,
1392
+ "rones": 32624,
1393
+ "rosa": 33557,
1394
+ "roso": 33212,
1395
+ "roto": 33502,
1396
+ "rovia": 32829,
1397
+ "rra": 32108,
1398
+ "rri": 32693,
1399
+ "rueba": 32710,
1400
+ "rupa": 32351,
1401
+ "rupi": 32707,
1402
+ "rusu": 32643,
1403
+ "ruta": 32198,
1404
+ "rutos": 33186,
1405
+ "ruvicha": 33041,
1406
+ "rypy": 32932,
1407
+ "ryru": 32906,
1408
+ "ryvu": 33676,
1409
+ "rán": 32867,
1410
+ "ráneo": 33506,
1411
+ "rã": 32883,
1412
+ "réra": 32581,
1413
+ "rías": 33729,
1414
+ "río": 32623,
1415
+ "ríos": 33598,
1416
+ "rô": 33357,
1417
+ "rõ": 32153,
1418
+ "sabiduría": 32575,
1419
+ "sacerdo": 32654,
1420
+ "sacerdote": 32125,
1421
+ "sada": 32169,
1422
+ "sado": 33285,
1423
+ "sagrado": 33644,
1424
+ "sales": 32942,
1425
+ "salto": 32617,
1426
+ "salud": 32475,
1427
+ "salva": 32516,
1428
+ "salvado": 32148,
1429
+ "samo": 32599,
1430
+ "sangre": 33628,
1431
+ "santa": 32881,
1432
+ "santo": 32664,
1433
+ "sapukái": 33314,
1434
+ "sapy": 33362,
1435
+ "sar": 32428,
1436
+ "sas": 32863,
1437
+ "secreta": 33061,
1438
+ "secreto": 32571,
1439
+ "secundaria": 32155,
1440
+ "segundo": 32062,
1441
+ "según": 33309,
1442
+ "seis": 32376,
1443
+ "selva": 33441,
1444
+ "seos": 33416,
1445
+ "serra": 33680,
1446
+ "seve": 32271,
1447
+ "seña": 32372,
1448
+ "señor": 33421,
1449
+ "sia": 32503,
1450
+ "sible": 32800,
1451
+ "sidad": 32757,
1452
+ "siempre": 32022,
1453
+ "siete": 33684,
1454
+ "sigui": 33529,
1455
+ "silve": 33292,
1456
+ "silvestre": 32489,
1457
+ "sima": 33012,
1458
+ "simo": 32032,
1459
+ "sino": 33026,
1460
+ "sitio": 32628,
1461
+ "situación": 32780,
1462
+ "sivo": 33531,
1463
+ "sión": 33203,
1464
+ "sobre": 32776,
1465
+ "soledad": 32709,
1466
+ "soma": 32801,
1467
+ "sombra": 33458,
1468
+ "sos": 33136,
1469
+ "soy": 32651,
1470
+ "sticas": 32918,
1471
+ "stitu": 32353,
1472
+ "stres": 33739,
1473
+ "stro": 33414,
1474
+ "strucción": 32127,
1475
+ "stró": 33488,
1476
+ "suceso": 32404,
1477
+ "sueño": 32634,
1478
+ "sula": 33119,
1479
+ "superficie": 32269,
1480
+ "supre": 32254,
1481
+ "sus": 32388,
1482
+ "sé": 32014,
1483
+ "séva": 33248,
1484
+ "símbolo": 33279,
1485
+ "símbolos": 33476,
1486
+ "só": 32462,
1487
+ "sólo": 33253,
1488
+ "tación": 33698,
1489
+ "tada": 33219,
1490
+ "tado": 33125,
1491
+ "tadores": 32658,
1492
+ "tai": 32714,
1493
+ "taja": 32741,
1494
+ "takua": 33048,
1495
+ "tales": 33322,
1496
+ "tano": 32512,
1497
+ "tante": 32668,
1498
+ "tara": 32361,
1499
+ "tare": 32287,
1500
+ "tas": 33106,
1501
+ "tata": 33498,
1502
+ "tatu": 32859,
1503
+ "teatro": 33523,
1504
+ "tend": 33736,
1505
+ "tene": 32180,
1506
+ "tercera": 32255,
1507
+ "teri": 32719,
1508
+ "terias": 32472,
1509
+ "terio": 32802,
1510
+ "termina": 32173,
1511
+ "tero": 32461,
1512
+ "terro": 33363,
1513
+ "tería": 33372,
1514
+ "tesaráipe": 33306,
1515
+ "tesis": 32425,
1516
+ "tica": 32157,
1517
+ "ticas": 32873,
1518
+ "ticias": 33074,
1519
+ "tico": 32520,
1520
+ "ticos": 32105,
1521
+ "tida": 33504,
1522
+ "tido": 32112,
1523
+ "tiempos": 32981,
1524
+ "tierra": 33585,
1525
+ "tigre": 32161,
1526
+ "tiles": 32262,
1527
+ "timo": 32152,
1528
+ "timología": 32077,
1529
+ "timí": 33599,
1530
+ "tina": 32088,
1531
+ "tini": 32510,
1532
+ "tisfechas": 32871,
1533
+ "tiva": 33064,
1534
+ "tivas": 32586,
1535
+ "tividad": 33261,
1536
+ "tivo": 32093,
1537
+ "tivos": 32060,
1538
+ "tores": 32806,
1539
+ "toria": 33072,
1540
+ "tortura": 32874,
1541
+ "trabajos": 32717,
1542
+ "tradicional": 32868,
1543
+ "tradición": 33546,
1544
+ "tradu": 32721,
1545
+ "traje": 33561,
1546
+ "tral": 33480,
1547
+ "tran": 33305,
1548
+ "transporte": 32917,
1549
+ "treinta": 32395,
1550
+ "tribu": 33554,
1551
+ "triste": 32288,
1552
+ "triun": 32167,
1553
+ "tro": 33293,
1554
+ "tros": 32866,
1555
+ "tru": 33601,
1556
+ "trá": 32047,
1557
+ "tré": 32933,
1558
+ "tró": 32099,
1559
+ "tua": 32993,
1560
+ "tud": 32819,
1561
+ "tuguy": 32054,
1562
+ "tula": 33583,
1563
+ "tuo": 32349,
1564
+ "tupa": 32940,
1565
+ "tupi": 32234,
1566
+ "tura": 33621,
1567
+ "tyvy": 33669,
1568
+ "tá": 33211,
1569
+ "tái": 32300,
1570
+ "tépe": 32573,
1571
+ "térito": 33268,
1572
+ "tévo": 33083,
1573
+ "tí": 33641,
1574
+ "tía": 32935,
1575
+ "tógrafo": 32747,
1576
+ "tórica": 33656,
1577
+ "tóricas": 33704,
1578
+ "tórico": 33313,
1579
+ "tú": 32346,
1580
+ "uca": 32355,
1581
+ "udades": 32761,
1582
+ "uelo": 32111,
1583
+ "ueta": 32671,
1584
+ "ueve": 33149,
1585
+ "ufra": 33450,
1586
+ "uka": 32340,
1587
+ "umíva": 33651,
1588
+ "upe": 33158,
1589
+ "upyrã": 32611,
1590
+ "upéicha": 33243,
1591
+ "upépe": 33265,
1592
+ "urna": 32431,
1593
+ "usto": 32162,
1594
+ "vaekue": 33637,
1595
+ "vai": 32805,
1596
+ "valle": 33543,
1597
+ "vana": 32708,
1598
+ "vei": 32459,
1599
+ "vención": 33255,
1600
+ "venganza": 32879,
1601
+ "venir": 32375,
1602
+ "ventura": 32953,
1603
+ "venturas": 33393,
1604
+ "vera": 33696,
1605
+ "verbo": 33516,
1606
+ "verdade": 32089,
1607
+ "verdadero": 32603,
1608
+ "versa": 33206,
1609
+ "verte": 32620,
1610
+ "verá": 33002,
1611
+ "vete": 32570,
1612
+ "veve": 33054,
1613
+ "viaje": 32723,
1614
+ "viano": 33606,
1615
+ "vice": 33664,
1616
+ "vida": 32926,
1617
+ "vido": 33533,
1618
+ "vie": 33224,
1619
+ "viejo": 32951,
1620
+ "viento": 32686,
1621
+ "viera": 32994,
1622
+ "vies": 32737,
1623
+ "villa": 32392,
1624
+ "villas": 33435,
1625
+ "vino": 32663,
1626
+ "vio": 33114,
1627
+ "virtud": 33349,
1628
+ "visi": 33264,
1629
+ "visitante": 32614,
1630
+ "visión": 33699,
1631
+ "viuda": 33419,
1632
+ "viva": 33028,
1633
+ "vivi": 32265,
1634
+ "vivo": 32519,
1635
+ "voca": 32028,
1636
+ "voi": 32878,
1637
+ "vos": 32672,
1638
+ "voz": 33182,
1639
+ "vu": 32583,
1640
+ "vén": 32636,
1641
+ "vía": 33010,
1642
+ "vío": 33721,
1643
+ "xima": 33377,
1644
+ "ximo": 33070,
1645
+ "xo": 32773,
1646
+ "xto": 32847,
1647
+ "yas": 33298,
1648
+ "yen": 32782,
1649
+ "yenda": 32602,
1650
+ "yendas": 33173,
1651
+ "yerba": 32109,
1652
+ "yga": 33428,
1653
+ "ygarata": 33580,
1654
+ "ygarusu": 32930,
1655
+ "yguasu": 33080,
1656
+ "yi": 32638,
1657
+ "yju": 33281,
1658
+ "ykua": 33143,
1659
+ "ymba": 32815,
1660
+ "yos": 33161,
1661
+ "ypy": 33124,
1662
+ "ypykue": 32405,
1663
+ "ysy": 33073,
1664
+ "ysypo": 32091,
1665
+ "yta": 33430,
1666
+ "yu": 33141,
1667
+ "yvy": 33513,
1668
+ "yvyra": 32156,
1669
+ "yvytu": 33438,
1670
+ "yvyty": 33151,
1671
+ "yá": 33218,
1672
+ "zada": 32742,
1673
+ "zadas": 33031,
1674
+ "zado": 32534,
1675
+ "zan": 33613,
1676
+ "zar": 33337,
1677
+ "zco": 32661,
1678
+ "zos": 33049,
1679
+ "Ára": 33283,
1680
+ "ÉRA": 33092,
1681
+ "ÑAN": 33422,
1682
+ "Ña": 32130,
1683
+ "Ñande": 32016,
1684
+ "Ñandejára": 32033,
1685
+ "Ñe": 32394,
1686
+ "Ñemo": 32833,
1687
+ "Ñorairõ": 33734,
1688
+ "ái": 33302,
1689
+ "ánte": 32357,
1690
+ "ápe": 32422,
1691
+ "ápo": 32631,
1692
+ "ári": 33246,
1693
+ "áva": 33335,
1694
+ "ãva": 32750,
1695
+ "éndo": 33679,
1696
+ "épe": 33473,
1697
+ "éroes": 32546,
1698
+ "éy": 33209,
1699
+ "êva": 33059,
1700
+ "íba": 33202,
1701
+ "íces": 32547,
1702
+ "ída": 32383,
1703
+ "íos": 32880,
1704
+ "írculo": 33174,
1705
+ "ísimo": 32522,
1706
+ "íz": 32139,
1707
+ "ñada": 32024,
1708
+ "ñana": 33128,
1709
+ "ñand": 32163,
1710
+ "ñande": 33003,
1711
+ "ñang": 33446,
1712
+ "ñar": 32577,
1713
+ "ñas": 33550,
1714
+ "ñaña": 33697,
1715
+ "ñe": 32483,
1716
+ "ñemy": 33021,
1717
+ "ñera": 33499,
1718
+ "ñez": 32027,
1719
+ "ñoke": 32989,
1720
+ "ñokendavoka": 32328,
1721
+ "ñoty": 32954,
1722
+ "ñu": 33713,
1723
+ "ñó": 32814,
1724
+ "óga": 32849,
1725
+ "ói": 33465,
1726
+ "ólo": 32232,
1727
+ "óma": 33642,
1728
+ "óme": 33675,
1729
+ "ómetros": 33475,
1730
+ "ónga": 32043,
1731
+ "ónica": 33735,
1732
+ "ópe": 32996,
1733
+ "óra": 32298,
1734
+ "óto": 32320,
1735
+ "õi": 32330,
1736
+ "úda": 33452,
1737
+ "última": 32950,
1738
+ "último": 32140,
1739
+ "único": 33162,
1740
+ "úva": 33576,
1741
+ "ýgui": 33275,
1742
+ "ýpe": 32514
1743
+ }
special_tokens_map.json ADDED
@@ -0,0 +1,30 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "bos_token": {
3
+ "content": "<s>",
4
+ "lstrip": false,
5
+ "normalized": false,
6
+ "rstrip": false,
7
+ "single_word": false
8
+ },
9
+ "eos_token": {
10
+ "content": "</s>",
11
+ "lstrip": false,
12
+ "normalized": false,
13
+ "rstrip": false,
14
+ "single_word": false
15
+ },
16
+ "pad_token": {
17
+ "content": "<unk>",
18
+ "lstrip": false,
19
+ "normalized": false,
20
+ "rstrip": false,
21
+ "single_word": false
22
+ },
23
+ "unk_token": {
24
+ "content": "<unk>",
25
+ "lstrip": false,
26
+ "normalized": false,
27
+ "rstrip": false,
28
+ "single_word": false
29
+ }
30
+ }
tokenizer.json ADDED
The diff for this file is too large to render. See raw diff
 
tokenizer.model ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:dadfd56d766715c61d2ef780a525ab43b8e6da4de6865bda3d95fdef5e134055
3
+ size 493443
tokenizer_config.json ADDED
The diff for this file is too large to render. See raw diff