Spaces:

Mairaaa
/

fyp-deploy

Running

App Files Files Community

Mairaaa commited on Jan 18

Commit

5fba144

verified ·

1 Parent(s): e22ce03

Update app.py

Browse files

Files changed (1) hide show

app.py +18 -30

app.py CHANGED Viewed

@@ -1,12 +1,11 @@
 import os
-import pandas as np
 import torch
 import streamlit as st
 from PIL import Image
 from accelerate import Accelerator
 from diffusers import DDIMScheduler, AutoencoderKL
 from transformers import CLIPTextModel, CLIPTokenizer
-from src.mgd_pipelines.mgd_pipe import MGDPipe
 from src.mgd_pipelines.mgd_pipe_disentangled import MGDPipeDisentangled
 from src.utils.set_seeds import set_seed
 from src.utils.image_from_pipe import generate_images_from_mgd_pipe
@@ -17,8 +16,7 @@ os.environ["TOKENIZERS_PARALLELISM"] = "true"
 os.environ["WANDB_START_METHOD"] = "thread"
 # Function to process inputs and run inference
-def run_inference(prompt, sketch_image=None, category="dresses", seed=None, mixed_precision="fp16"):
-    # Initialize accelerator
     accelerator = Accelerator(mixed_precision=mixed_precision)
     device = accelerator.device
@@ -26,39 +24,35 @@ def run_inference(prompt, sketch_image=None, category="dresses", seed=None, mixe
     tokenizer = CLIPTokenizer.from_pretrained("microsoft/xclip-base-patch32", subfolder="tokenizer")
     text_encoder = CLIPTextModel.from_pretrained("microsoft/xclip-base-patch32", subfolder="text_encoder")
     vae = AutoencoderKL.from_pretrained("stabilityai/sd-vae-ft-mse", subfolder="vae")
-    val_scheduler = DDIMScheduler.from_pretrained("ptx0/pseudo-journey-v2", subfolder="scheduler")
-    # Load UNet (assumed pretrained)
     unet = torch.hub.load("aimagelab/multimodal-garment-designer", "mgd", pretrained=True)
-    # Freeze VAE and text encoder
     vae.requires_grad_(False)
     text_encoder.requires_grad_(False)
-    # Set seed for reproducibility
     if seed is not None:
         set_seed(seed)
-    # Load appropriate dataset
     category = [category]
     test_dataset = DressCodeDataset(
-        dataroot_path="path_to_dataset", phase="test", category=category, size=(512, 384)
     )
     test_dataloader = torch.utils.data.DataLoader(test_dataset, batch_size=1, shuffle=False)
-    # Move models to the device
     text_encoder.to(device)
     vae.to(device)
     unet.to(device).eval()
-    # Handle sketch and text inputs
     if sketch_image is not None:
-        # Process the sketch (resize, normalize, etc.)
-        sketch_image = sketch_image.resize((512, 384))
-        sketch_tensor = torch.tensor(np.array(sketch_image)).unsqueeze(0).float().to(device)
-    # Select pipeline (disentangled if required)
     val_pipe = MGDPipeDisentangled(
         text_encoder=text_encoder,
         vae=vae,
@@ -69,41 +63,35 @@ def run_inference(prompt, sketch_image=None, category="dresses", seed=None, mixe
     val_pipe.enable_attention_slicing()
-    # Generate image
     generated_images = generate_images_from_mgd_pipe(
         test_dataloader=test_dataloader,
         pipe=val_pipe,
         guidance_scale=7.5,
         seed=seed,
         sketch_image=sketch_tensor if sketch_image is not None else None,
-        prompt=prompt
     )
-    return generated_images[0]  # Assuming single image output
 # Streamlit UI
 st.title("Fashion Image Generator")
 st.write("Generate colorful fashion images based on a rough sketch and/or a text prompt.")
-# Upload a sketch image
 uploaded_sketch = st.file_uploader("Upload a rough sketch (optional)", type=["png", "jpg", "jpeg"])
-# Text input for prompt
 prompt = st.text_input("Enter a prompt (optional)", "A red dress with floral patterns")
-# Input options
 category = st.text_input("Enter category (optional):", "dresses")
-seed = st.slider("Seed", min_value=1, max_value=100, step=1, value=None)
 precision = st.selectbox("Select precision:", ["fp16", "fp32"])
-# Show uploaded sketch image
 if uploaded_sketch is not None:
     sketch_image = Image.open(uploaded_sketch)
     st.image(sketch_image, caption="Uploaded Sketch", use_column_width=True)
-# Button to generate image
 if st.button("Generate Image"):
     with st.spinner("Generating image..."):
-        # Run inference with sketch or prompt (or both)
-        result_image = run_inference(prompt, sketch_image, category, seed, precision)
-        st.image(result_image, caption="Generated Image", use_column_width=True)

 import os
+import numpy as np  # Corrected import
 import torch
 import streamlit as st
 from PIL import Image
 from accelerate import Accelerator
 from diffusers import DDIMScheduler, AutoencoderKL
 from transformers import CLIPTextModel, CLIPTokenizer
 from src.mgd_pipelines.mgd_pipe_disentangled import MGDPipeDisentangled
 from src.utils.set_seeds import set_seed
 from src.utils.image_from_pipe import generate_images_from_mgd_pipe
 os.environ["WANDB_START_METHOD"] = "thread"
 # Function to process inputs and run inference
+def run_inference(prompt, sketch_image=None, category="dresses", seed=1, mixed_precision="fp16"):
     accelerator = Accelerator(mixed_precision=mixed_precision)
     device = accelerator.device
     tokenizer = CLIPTokenizer.from_pretrained("microsoft/xclip-base-patch32", subfolder="tokenizer")
     text_encoder = CLIPTextModel.from_pretrained("microsoft/xclip-base-patch32", subfolder="text_encoder")
     vae = AutoencoderKL.from_pretrained("stabilityai/sd-vae-ft-mse", subfolder="vae")
+    val_scheduler = DDIMScheduler.from_pretrained("stabilityai/sd-scheduler", subfolder="scheduler")
     unet = torch.hub.load("aimagelab/multimodal-garment-designer", "mgd", pretrained=True)
     vae.requires_grad_(False)
     text_encoder.requires_grad_(False)
     if seed is not None:
         set_seed(seed)
     category = [category]
     test_dataset = DressCodeDataset(
+        dataroot_path="assets\data\dresscode",  # Replace with actual dataset path
+        phase="test",
+        category=category,
+        size=(512, 384),
     )
     test_dataloader = torch.utils.data.DataLoader(test_dataset, batch_size=1, shuffle=False)
     text_encoder.to(device)
     vae.to(device)
     unet.to(device).eval()
     if sketch_image is not None:
+        sketch_tensor = (
+            torch.tensor(np.array(sketch_image)).permute(2, 0, 1).unsqueeze(0).float().to(device) / 255.0
+        )
     val_pipe = MGDPipeDisentangled(
         text_encoder=text_encoder,
         vae=vae,
     val_pipe.enable_attention_slicing()
     generated_images = generate_images_from_mgd_pipe(
         test_dataloader=test_dataloader,
         pipe=val_pipe,
         guidance_scale=7.5,
         seed=seed,
         sketch_image=sketch_tensor if sketch_image is not None else None,
+        prompt=prompt,
     )
+    return Image.fromarray((generated_images[0] * 255).astype("uint8"))
 # Streamlit UI
 st.title("Fashion Image Generator")
 st.write("Generate colorful fashion images based on a rough sketch and/or a text prompt.")
 uploaded_sketch = st.file_uploader("Upload a rough sketch (optional)", type=["png", "jpg", "jpeg"])
 prompt = st.text_input("Enter a prompt (optional)", "A red dress with floral patterns")
 category = st.text_input("Enter category (optional):", "dresses")
+seed = st.slider("Seed", min_value=1, max_value=100, step=1, value=1)
 precision = st.selectbox("Select precision:", ["fp16", "fp32"])
 if uploaded_sketch is not None:
     sketch_image = Image.open(uploaded_sketch)
     st.image(sketch_image, caption="Uploaded Sketch", use_column_width=True)
 if st.button("Generate Image"):
     with st.spinner("Generating image..."):
+        try:
+            result_image = run_inference(prompt, sketch_image, category, seed, precision)
+            st.image(result_image, caption="Generated Image", use_column_width=True)
+        except Exception as e:
+            st.error(f"An error occurred: {e}")