MergeLlama-7b

Paused

codys12 commited on Oct 17, 2023

Commit

35a83a6

1 Parent(s): 92e6ccb

Fixed it

Files changed (1) hide show

app.py CHANGED Viewed

@@ -20,7 +20,7 @@ MAX_INPUT_TOKEN_LENGTH = 4096
 if torch.cuda.is_available():
     model_id = "codys12/MergeLlama-7b"
-    model = AutoModelForCausalLM.from_pretrained(model_id, torch_dtype=torch.float16)
     model.cuda()
     tokenizer = AutoTokenizer.from_pretrained(model_id)
@@ -44,7 +44,7 @@ def generate(
     current_input += message
     device = "cuda:0"
-    inputs_ids = tokenizer(current_input, return_tensors="pt").to(device)
     if len(input_ids) > MAX_INPUT_TOKEN_LENGTH:
         input_ids = input_ids[-MAX_INPUT_TOKEN_LENGTH:]

 if torch.cuda.is_available():
     model_id = "codys12/MergeLlama-7b"
+    model = AutoModelForCausalLM.from_pretrained(model_id, torch_dtype=torch.float16, device_map=0,)
     model.cuda()
     tokenizer = AutoTokenizer.from_pretrained(model_id)
     current_input += message
     device = "cuda:0"
+    input_ids = tokenizer(current_input, return_tensors="pt").to(device)
     if len(input_ids) > MAX_INPUT_TOKEN_LENGTH:
         input_ids = input_ids[-MAX_INPUT_TOKEN_LENGTH:]