sdxl-turbo

Paused

App Files Files Community

tsi-org commited on Nov 29, 2023

Commit

6b6c817

1 Parent(s): 3c87bd8

Update app.py

Browse files

Files changed (1) hide show

app.py +30 -22

app.py CHANGED Viewed

@@ -3,41 +3,49 @@ from diffusers import AutoPipelineForText2Image, AutoPipelineForImage2Image
 from diffusers.utils import load_image
 import torch
-if torch.cuda.is_available():
-  device = "cuda"
-elif torch.backends.mps.is_available():
-  device = "mps"
-else:
-  device = "cpu"
 pipes = {
-  "txt2img": AutoPipelineForText2Image.from_pretrained("stabilityai/sdxl-turbo", torch_dtype=torch.float16, variant="fp16").to(device),
-  "img2img": AutoPipelineForImage2Image.from_pretrained("stabilityai/sdxl-turbo", torch_dtype=torch.float16, variant="fp16").to(device)
 }
 if device == "cpu":
-  pipes["txt2img"].enable_model_cpu_offload()
-  pipes["img2img"].enable_model_cpu_offload()
 def run(prompt, image):
-  print(f"prompt={prompt}, image={image}")
-  if image is None:
-    return pipes["txt2img"](prompt=prompt, num_inference_steps=1, guidance_scale=0.0).images[0]
-  else:
-    image = image.resize((512,512))
-    print(f"img2img image={image}")
-    return pipes["img2img"](prompt, image=image, num_inference_steps=2, strength=0.5, guidance_scale=0.0).images[0]
 demo = gr.Interface(
     run,
     inputs=[
-      gr.Textbox(label="Prompt"),
-      gr.Image(type="pil")
     ],
-    outputs=gr.Image(width=512,height=512),
     live=True
 )
-#demo.dependencies[0]["show_progress"] = "minimal"
 demo.launch()

 from diffusers.utils import load_image
 import torch
+# Clear CUDA cache
+torch.cuda.empty_cache()
+# Set environment variable for memory fragmentation
+import os
+os.environ['PYTORCH_CUDA_ALLOC_CONF'] = 'max_split_size_mb:128'
+device = "cuda" if torch.cuda.is_available() else "cpu"
 pipes = {
+    "txt2img": AutoPipelineForText2Image.from_pretrained("stabilityai/sdxl-turbo", torch_dtype=torch.float16, variant="fp16").to(device),
+    "img2img": AutoPipelineForImage2Image.from_pretrained("stabilityai/sdxl-turbo", torch_dtype=torch.float16, variant="fp16").to(device)
 }
 if device == "cpu":
+    pipes["txt2img"].enable_model_cpu_offload()
+    pipes["img2img"].enable_model_cpu_offload()
 def run(prompt, image):
+    try:
+        print(f"prompt={prompt}, image={image}")
+        if image is None:
+            return pipes["txt2img"](prompt=prompt, num_inference_steps=1, guidance_scale=0.0).images[0]
+        else:
+            image = image.resize((512,512))
+            print(f"img2img image={image}")
+            return pipes["img2img"](prompt, image=image, num_inference_steps=2, strength=0.5, guidance_scale=0.0).images[0]
+    except RuntimeError as e:
+        if "CUDA out of memory" in str(e):
+            print("CUDA out of memory. Trying to clear cache.")
+            torch.cuda.empty_cache()
+            # Consider additional fallback strategies here
+        else:
+            raise e
 demo = gr.Interface(
     run,
     inputs=[
+        gr.Textbox(label="Prompt"),
+        gr.Image(type="pil")
     ],
+    outputs=gr.Image(width=512, height=512),
     live=True
 )
 demo.launch()