oleksandrfluxon
/

mpt-7b-instruct

Text Generation

text-generation-inference

Model card Files Files and versions Community

oleksandrfluxon commited on Jul 21, 2023

Commit

377986e

·

1 Parent(s): 76a36d6

Update handler.py

Files changed (1) hide show

handler.py +2 -2

handler.py CHANGED Viewed

@@ -1,7 +1,7 @@
 import torch
 from typing import Any, Dict
-from transformers import AutoModelForCausalLM, AutoTokenizer
 class EndpointHandler:
@@ -9,7 +9,7 @@ class EndpointHandler:
         # load model and tokenizer from path
         self.tokenizer = AutoTokenizer.from_pretrained(path) # AutoTokenizer.from_pretrained("EleutherAI/gpt-neox-20b")
-        config = transformers.AutoConfig.from_pretrained(name, trust_remote_code=True)
         config.attn_config['attn_impl'] = 'triton'
         config.init_device = 'cuda:0' # For fast initialization directly on GPU!
         config.max_seq_len = 4096 # (input + output) tokens can now be up to 4096

 import torch
 from typing import Any, Dict
+from transformers import AutoModelForCausalLM, AutoTokenizer, AutoConfig
 class EndpointHandler:
         # load model and tokenizer from path
         self.tokenizer = AutoTokenizer.from_pretrained(path) # AutoTokenizer.from_pretrained("EleutherAI/gpt-neox-20b")
+        config = AutoConfig.from_pretrained(name, trust_remote_code=True)
         config.attn_config['attn_impl'] = 'triton'
         config.init_device = 'cuda:0' # For fast initialization directly on GPU!
         config.max_seq_len = 4096 # (input + output) tokens can now be up to 4096