anzorq
/

m2m100_1.2B_ft_ru-kbd_50K

Text2Text Generation

Generated from Trainer

Inference Endpoints

Model card Files Files and versions Community

anzorq commited on Sep 27, 2023

Commit

5a48f6a

•

1 Parent(s): 420f041

best model, 7K steps

Files changed (1) hide show

tokenizer_config.json +3 -3

tokenizer_config.json CHANGED Viewed

@@ -105,13 +105,13 @@
   "clean_up_tokenization_spaces": true,
   "eos_token": "</s>",
   "language_codes": "m2m100",
-  "model_max_length": 1000000000000000019884624838656,
   "num_madeup_words": 8,
   "pad_token": "<pad>",
   "sep_token": "</s>",
   "sp_model_kwargs": {},
-  "src_lang": null,
-  "tgt_lang": null,
   "tokenizer_class": "M2M100Tokenizer",
   "tokenizer_file": null,
   "unk_token": "<unk>"

   "clean_up_tokenization_spaces": true,
   "eos_token": "</s>",
   "language_codes": "m2m100",
+  "model_max_length": 1024,
   "num_madeup_words": 8,
   "pad_token": "<pad>",
   "sep_token": "</s>",
   "sp_model_kwargs": {},
+  "src_lang": "ru",
+  "tgt_lang": "zu",
   "tokenizer_class": "M2M100Tokenizer",
   "tokenizer_file": null,
   "unk_token": "<unk>"