Spaces:

askbyte
/

biter-zephyr

Running

askbyte commited on Mar 22

Commit

7b48c13

verified ·

1 Parent(s): 3e9bc78

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -51,12 +51,12 @@ print("Cargando modelo ligero...")
 model_name = "microsoft/phi-2"  # Modelo de 2.7B parámetros, mucho más ligero que 7B
 # Configuración para reducir el uso de memoria
 tokenizer = AutoTokenizer.from_pretrained(model_name)
 model = AutoModelForCausalLM.from_pretrained(
     model_name,
     torch_dtype=torch.float32,
-    low_cpu_mem_usage=True,
-    device_map="auto"
 )
 # Crear el pipeline de generación de texto
@@ -89,4 +89,5 @@ demo = gr.Interface(
 # Lanzar la aplicación con configuración para ahorrar memoria
 if __name__ == "__main__":
     # Configurar menos workers para ahorrar memoria
-    demo.queue(max_size=1).launch(share=False, debug=False)

 model_name = "microsoft/phi-2"  # Modelo de 2.7B parámetros, mucho más ligero que 7B
 # Configuración para reducir el uso de memoria
+# IMPORTANTE: Eliminamos device_map="auto" que no es compatible con Phi-2
 tokenizer = AutoTokenizer.from_pretrained(model_name)
 model = AutoModelForCausalLM.from_pretrained(
     model_name,
     torch_dtype=torch.float32,
+    low_cpu_mem_usage=True
 )
 # Crear el pipeline de generación de texto
 # Lanzar la aplicación con configuración para ahorrar memoria
 if __name__ == "__main__":
     # Configurar menos workers para ahorrar memoria
+    demo.queue(max_size=1).launch(share=False, debug=False)