Kristijan
/

gpt2_wt103_12-layer

Model card Files Files and versions Community

Kristijan commited on Mar 30, 2023

Commit

744c3c2

·

1 Parent(s): 28880b5

Update README.md

Files changed (1) hide show

README.md +3 -1

README.md CHANGED Viewed

@@ -54,11 +54,13 @@ model = GPT2LMHeadModel.from_pretrained(path_to_folder_with_checkpoint_files)
 You should first pretokenize your text using the [MosesTokenizer](https://pypi.org/project/mosestokenizer/):
 ```python
 with MosesTokenizer('en') as pretokenize:
     pretokenized_text = " ".join(pretokenize(text_string))
 ```
-To tokenize your text for this model, you should use the [tokenizer trained on Wikitext-103](https://huggingface.co/Kristijan/wikitext-103-tokenizer_v2):
 ```python
 from transformers import GPT2TokenizerFast

 You should first pretokenize your text using the [MosesTokenizer](https://pypi.org/project/mosestokenizer/):
 ```python
+from mosestokenizer import MosesTokenizer
 with MosesTokenizer('en') as pretokenize:
     pretokenized_text = " ".join(pretokenize(text_string))
 ```
+Then, to BPE tokenize your text for this model, you should use the [tokenizer trained on Wikitext-103](https://huggingface.co/Kristijan/wikitext-103-tokenizer_v2):
 ```python
 from transformers import GPT2TokenizerFast