Spaces:

Blancior
/

rpg-battle-gemma

Runtime error

Blancior commited on Dec 19, 2024

Commit

4496835

verified ·

1 Parent(s): cf0fd37

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -4,15 +4,18 @@ import torch
 def load_model():
     model_name = "TheBloke/Llama-2-13B-chat-GPTQ"
-    tokenizer = AutoTokenizer.from_pretrained(model_name)
     model = AutoModelForCausalLM.from_pretrained(
         model_name,
         device_map="auto",
         trust_remote_code=True,
-        revision="main"
     )
     return model, tokenizer
 def generate_response(prompt, max_length=100):
     try:
         inputs = tokenizer(prompt, return_tensors="pt").to(model.device)

 def load_model():
     model_name = "TheBloke/Llama-2-13B-chat-GPTQ"
+    tokenizer = AutoTokenizer.from_pretrained(model_name, use_fast=True)
     model = AutoModelForCausalLM.from_pretrained(
         model_name,
         device_map="auto",
         trust_remote_code=True,
+        revision="main",
+        quantization_config={"load_in_4bit": True}  # Dodajemy kwantyzację 4-bitową
     )
     return model, tokenizer
+# Reszta kodu pozostaje bez zmian
 def generate_response(prompt, max_length=100):
     try:
         inputs = tokenizer(prompt, return_tensors="pt").to(model.device)