Spaces:

GIGAParviz
/

Parviz_Mind

Sleeping

GIGAParviz commited on Aug 22, 2024

Commit

d118a29

verified ·

1 Parent(s): 8b0d499

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -8,7 +8,7 @@ model, tokenizer = FastLanguageModel.from_pretrained(
     max_seq_length = 2048,
     dtype = torch.float16,
     load_in_4bit = True,
-)
 FastLanguageModel.for_inference(model)
 def predict(input_text):
@@ -20,7 +20,7 @@ def predict(input_text):
         tokenize=True,
         add_generation_prompt=True,
         return_tensors="pt",
-    )
     outputs = model.generate(
         input_ids=inputs,

     max_seq_length = 2048,
     dtype = torch.float16,
     load_in_4bit = True,
+).to("cpu")
 FastLanguageModel.for_inference(model)
 def predict(input_text):
         tokenize=True,
         add_generation_prompt=True,
         return_tensors="pt",
+    ).to("cpu")
     outputs = model.generate(
         input_ids=inputs,