TheBloke-starchat-beta-GPTQ

Runtime error

binqiangliu commited on Oct 24, 2023

Commit

0266d0b

1 Parent(s): 42d6a0b

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -15,10 +15,13 @@ use_triton = False
 tokenizer = AutoTokenizer.from_pretrained(model_name_or_path, use_fast=True)
 model = AutoGPTQForCausalLM.from_quantized(model_name_or_path,
         use_safetensors=True,
         #device="cuda:0",
-        device_map="auto",
         use_triton=use_triton,
         quantize_config=None)

 tokenizer = AutoTokenizer.from_pretrained(model_name_or_path, use_fast=True)
+device="cuda" if torch.cuda.is_available() else "cpu"):
 model = AutoGPTQForCausalLM.from_quantized(model_name_or_path,
         use_safetensors=True,
         #device="cuda:0",
+        device=device,
+        #device_map="auto",
         use_triton=use_triton,
         quantize_config=None)