Spaces:

mrmax14
/

Thera

Runtime error

App Files Files Community

mrmax14 commited on Jan 27

Commit

0dee7a7

1 Parent(s): ff6dcdf

init commit

Browse files

Files changed (1) hide show

app.py +3 -20

app.py CHANGED Viewed

@@ -1,8 +1,6 @@
 import os
 from transformers import AutoTokenizer, AutoModelForCausalLM
 import torch
-from transformers import BitsAndBytesConfig
-from accelerate import Accelerator
 # Завантажуємо токен автентифікації з змінної середовища
 hf_token = os.getenv("HF_API_TOKEN")
@@ -10,33 +8,18 @@ hf_token = os.getenv("HF_API_TOKEN")
 # Ідентифікатор моделі
 model_id = "meta-llama/Llama-2-7b-hf"
-# Налаштування для BitsAndBytes
-bnb_config = BitsAndBytesConfig(
-    load_in_4bit=True,
-    bnb_4bit_use_double_quant=True,
-    bnb_4bit_quant_type="nf4",
-    bnb_4bit_compute_dtype=torch.bfloat16
-)
 # Завантажуємо токенізатор з Hugging Face
 tokenizer = AutoTokenizer.from_pretrained(model_id, use_auth_token=hf_token)
 tokenizer.pad_token = tokenizer.eos_token
-# Ініціалізація Accelerator для оптимізації використання пам'яті
-accelerator = Accelerator()
 # Завантажуємо модель на CPU з використанням автентифікації
 model = AutoModelForCausalLM.from_pretrained(
     model_id,
-    # device_map="cpu",  # Пробуйте без цього параметра
-    use_auth_token=hf_token,
-    low_cpu_mem_usage=True
 )
-# Переведення моделі на пристрій
-model = accelerator.prepare(model)
-# Тепер ви можете використовувати модель для генерації тексту, наприклад:
 input_text = "Hello, how are you?"
 inputs = tokenizer(input_text, return_tensors="pt")
 outputs = model.generate(inputs["input_ids"])

 import os
 from transformers import AutoTokenizer, AutoModelForCausalLM
 import torch
 # Завантажуємо токен автентифікації з змінної середовища
 hf_token = os.getenv("HF_API_TOKEN")
 # Ідентифікатор моделі
 model_id = "meta-llama/Llama-2-7b-hf"
 # Завантажуємо токенізатор з Hugging Face
 tokenizer = AutoTokenizer.from_pretrained(model_id, use_auth_token=hf_token)
 tokenizer.pad_token = tokenizer.eos_token
 # Завантажуємо модель на CPU з використанням автентифікації
 model = AutoModelForCausalLM.from_pretrained(
     model_id,
+    device_map="cpu",  # Завантажуємо модель на CPU
+    use_auth_token=hf_token
 )
+# Тепер ви можете використовувати модель для генерації тексту
 input_text = "Hello, how are you?"
 inputs = tokenizer(input_text, return_tensors="pt")
 outputs = model.generate(inputs["input_ids"])