MagedSaeed
/

APCD-Plus-meter-classification-model

Text Classification

model_hub_mixin

pytorch_model_hub_mixin

Model card Files Files and versions Community

MagedSaeed commited on 27 days ago

Commit

e013219

·

verified ·

1 Parent(s): ae541cd

Upload tokenizer

Files changed (1) hide show

tokenizer_script.py +12 -0

tokenizer_script.py CHANGED Viewed

@@ -109,6 +109,18 @@ class CharacterTokenizer(PreTrainedTokenizer):
     def convert_tokens_to_string(self, tokens):
         return "".join(tokens)
     @classmethod
     def from_pretrained(cls, pretrained_model_name_or_path, *inputs, **kwargs):

     def convert_tokens_to_string(self, tokens):
         return "".join(tokens)
+      @classmethod
+    def from_json(cls, vocab_file, **kwargs):
+        with open(vocab_file, 'r', encoding='utf-8') as f:
+            vocab = json.load(f)
+        return cls(vocab=vocab, **kwargs)
+    @classmethod
+    def from_vocab(cls, vocab, **kwargs):
+        return cls(vocab=vocab, **kwargs)
     @classmethod
     def from_pretrained(cls, pretrained_model_name_or_path, *inputs, **kwargs):