Spaces:

tianyang
/

lemur-7B

Runtime error

tianyang commited on Jun 14, 2023

Commit

1bcf3fd

1 Parent(s): ab4d5a7

maybe fp16 works?

Files changed (1) hide show

utils/inference.py CHANGED Viewed

@@ -45,7 +45,7 @@ def load_tokenizer_and_model(base_model, adapter_model, load_8bit=True):
             )
     else:
         model = LlamaForCausalLM.from_pretrained(
-            base_model, device_map={"": device}, low_cpu_mem_usage=True
         )
         if adapter_model is not None:
             model = PeftModel.from_pretrained(

             )
     else:
         model = LlamaForCausalLM.from_pretrained(
+            base_model, device_map={"": device}, low_cpu_mem_usage=True, torch_dtype=torch.float16
         )
         if adapter_model is not None:
             model = PeftModel.from_pretrained(