SmolVLM

Running on Zero

andito HF Staff commited on Nov 19, 2024

Commit

0a651e1

verified ·

1 Parent(s): b5d8c52

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -6,14 +6,15 @@ from PIL import Image
 import torch
 import spaces
 import subprocess
-subprocess.run('pip install flash-attn --no-build-isolation', env={'FLASH_ATTENTION_SKIP_CUDA_BUILD': "TRUE"}, shell=True)
 processor = AutoProcessor.from_pretrained("HuggingFaceTB/SmolVLM_converted_4")
 model = Idefics3ForConditionalGeneration.from_pretrained("HuggingFaceTB/SmolVLM_converted_4",
         torch_dtype=torch.bfloat16,
-        _attn_implementation="flash_attention_2").to("cuda")
 @spaces.GPU
 def model_inference(

 import torch
 import spaces
 import subprocess
+#subprocess.run('pip install flash-attn --no-build-isolation', env={'FLASH_ATTENTION_SKIP_CUDA_BUILD': "TRUE"}, shell=True)
 processor = AutoProcessor.from_pretrained("HuggingFaceTB/SmolVLM_converted_4")
 model = Idefics3ForConditionalGeneration.from_pretrained("HuggingFaceTB/SmolVLM_converted_4",
         torch_dtype=torch.bfloat16,
+        #_attn_implementation="flash_attention_2"
+                                                        ).to("cuda")
 @spaces.GPU
 def model_inference(