MagedSaeed
/

APCD-Plus-meter-classification-model

Text Classification

model_hub_mixin

pytorch_model_hub_mixin

Model card Files Files and versions Community

MagedSaeed commited on Mar 17

Commit

06459c6

·

verified ·

1 Parent(s): 0599565

Update tokenizer_script.py

Files changed (1) hide show

tokenizer_script.py +1 -1

tokenizer_script.py CHANGED Viewed

@@ -90,7 +90,7 @@ class CharacterTokenizer(PreTrainedTokenizer):
             # properly handle padding side
             pad_id = self.vocab.get(self.pad_token, 0)
             max_len = max(len(ids) for ids in encoded_texts) if max_length is None else max_length
-            if tokenizer.padding_side == "right":
               encoded_texts = [ids + [pad_id] * (max_len - len(ids)) for ids in encoded_texts]
             else:
               encoded_texts = [[pad_id] * (max_len - len(ids)) + ids for ids in encoded_texts]

             # properly handle padding side
             pad_id = self.vocab.get(self.pad_token, 0)
             max_len = max(len(ids) for ids in encoded_texts) if max_length is None else max_length
+            if self.padding_side == "right":
               encoded_texts = [ids + [pad_id] * (max_len - len(ids)) for ids in encoded_texts]
             else:
               encoded_texts = [[pad_id] * (max_len - len(ids)) + ids for ids in encoded_texts]