Spaces:

ibm-granite
/

granite-guardian-3.1-8b

Running on Zero

Martín Santillán Cooper commited on 14 days ago

Commit

a50a656

•

1 Parent(s): fb6a6b8

fix: gpu is not a valid device

Files changed (1) hide show

model.py CHANGED Viewed

@@ -21,7 +21,7 @@ inference_engine = os.getenv("INFERENCE_ENGINE", "VLLM")
 logger.debug(f"Inference engine is: '{inference_engine}'")
 if inference_engine == "VLLM":
-    device = torch.device("gpu")
     model_path = os.getenv("MODEL_PATH", "ibm-granite/granite-guardian-3.0-8b")
     logger.debug(f"model_path is {model_path}")

 logger.debug(f"Inference engine is: '{inference_engine}'")
 if inference_engine == "VLLM":
+    device = torch.device("cuda")
     model_path = os.getenv("MODEL_PATH", "ibm-granite/granite-guardian-3.0-8b")
     logger.debug(f"model_path is {model_path}")