Spaces:

amos1088
/

test_gradio

Paused

amos1088 commited on Dec 17, 2024

Commit

d5f11d4

1 Parent(s): d09f5de

uuu

Files changed (1) hide show

app.py CHANGED Viewed

@@ -58,15 +58,17 @@ pipe.init_ipadapter(
     nb_token=64,
 )
 # ----------------------------
-# Step 5: Image Preprocessing Function
 # ----------------------------
 def preprocess_image(image_path):
-    """Preprocess the input image for the pipeline."""
     image = Image.open(image_path).convert("RGB")
-    # Ensure image is resized into a square based on the max dimension
-    size = max(image.size)
-    image = image.resize((size, size))
     preprocess = transforms.Compose([
         transforms.Resize((384, 384)),
@@ -75,14 +77,18 @@ def preprocess_image(image_path):
     ])
     return preprocess(image).unsqueeze(0).to("cuda")
 # ----------------------------
 # Step 6: Gradio Function
 # ----------------------------
 @spaces.GPU
 def gui_generation(prompt, ref_img, guidance_scale, ipadapter_scale):
     """Generate an image using Stable Diffusion 3.5 Large with IP-Adapter."""
-    # Preprocess the reference image
-    ref_img_tensor = preprocess_image(ref_img.name)
     # Run the pipeline
     with torch.no_grad():
@@ -100,6 +106,7 @@ def gui_generation(prompt, ref_img, guidance_scale, ipadapter_scale):
     return image
 # ----------------------------
 # Step 7: Gradio Interface
 # ----------------------------

     nb_token=64,
 )
 # ----------------------------
+# Step 5: Preprocess Reference Image
 # ----------------------------
 def preprocess_image(image_path):
+    """Ensure the input image is a valid PIL Image and resize it."""
     image = Image.open(image_path).convert("RGB")
+    # Ensure the image is resized into a square
+    size = max(image.size)  # Get the largest dimension
+    image = image.resize((size, size), Image.BILINEAR)
     preprocess = transforms.Compose([
         transforms.Resize((384, 384)),
     ])
     return preprocess(image).unsqueeze(0).to("cuda")
 # ----------------------------
 # Step 6: Gradio Function
 # ----------------------------
 @spaces.GPU
 def gui_generation(prompt, ref_img, guidance_scale, ipadapter_scale):
     """Generate an image using Stable Diffusion 3.5 Large with IP-Adapter."""
+    try:
+        # Load and preprocess the reference image
+        ref_img_tensor = preprocess_image(ref_img.name)
+    except Exception as e:
+        raise ValueError(f"Error loading reference image: {e}")
     # Run the pipeline
     with torch.no_grad():
     return image
 # ----------------------------
 # Step 7: Gradio Interface
 # ----------------------------