Spaces:

Serveurperso
/

gemma-2-2b-it-LoRA

Runtime error

Serveurperso commited on Mar 1

Commit

184d956

verified ·

1 Parent(s): 5d33da9

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -7,11 +7,10 @@ from huggingface_hub import login
 # 🔥 Installation/mise à jour des dépendances uniquement si nécessaire
 print("🚀 Vérification et mise à jour des dépendances...")
-os.system("pip install --no-cache-dir -U transformers peft accelerate torch bitsandbytes scipy")
-# 🔥 Correction de `libstdc++6` pour éviter les erreurs `bitsandbytes`
 os.system("apt-get update && apt-get install -y --reinstall libstdc++6")
-os.system("ln -sf /usr/lib/x86_64-linux-gnu/libstdc++.so.6.0.30 /usr/lib/x86_64-linux-gnu/libstdc++.so.6")
 print("✅ Dépendances corrigées et mises à jour !")
@@ -24,15 +23,15 @@ LORA_MODEL = "Serveurperso/gemma-2-2b-it-LoRA"
 print("🚀 Chargement du modèle Gemma 2B avec LoRA Mémé Ginette...")
-# 📌 Gestion automatique CPU/GPU
-device = "cuda" if torch.cuda.is_available() else "cpu"
 # 📌 Chargement du modèle principal
 try:
     model = AutoModelForCausalLM.from_pretrained(
         BASE_MODEL,
-        device_map="auto" if torch.cuda.is_available() else "cpu",  # Auto sur GPU si dispo
-        torch_dtype=torch.float16 if torch.cuda.is_available() else torch.float32,
         trust_remote_code=True
     )
@@ -40,8 +39,8 @@ try:
     model = PeftModel.from_pretrained(
         model,
         LORA_MODEL,
-        device_map="auto" if torch.cuda.is_available() else "cpu",
-        torch_dtype=torch.float16 if torch.cuda.is_available() else torch.float32,
     )
     tokenizer = AutoTokenizer.from_pretrained(LORA_MODEL)

 # 🔥 Installation/mise à jour des dépendances uniquement si nécessaire
 print("🚀 Vérification et mise à jour des dépendances...")
+os.system("pip install --no-cache-dir -U transformers peft accelerate torch scipy")
+# 🔥 Correction de `libstdc++6` pour éviter les erreurs
 os.system("apt-get update && apt-get install -y --reinstall libstdc++6")
 print("✅ Dépendances corrigées et mises à jour !")
 print("🚀 Chargement du modèle Gemma 2B avec LoRA Mémé Ginette...")
+# 📌 Forcer le CPU (pas de `bitsandbytes`)
+device = "cpu"
 # 📌 Chargement du modèle principal
 try:
     model = AutoModelForCausalLM.from_pretrained(
         BASE_MODEL,
+        device_map=device,  # **Forcé sur CPU**
+        torch_dtype=torch.float32,  # **Pas de float16 car CPU**
         trust_remote_code=True
     )
     model = PeftModel.from_pretrained(
         model,
         LORA_MODEL,
+        device_map=device,  # **Forcé sur CPU**
+        torch_dtype=torch.float32,  # **Pas de float16 car CPU**
     )
     tokenizer = AutoTokenizer.from_pretrained(LORA_MODEL)