Photo2ShojoManga

Running on Zero

App Files Files Community

tori29umai commited on Jun 19, 2024

Commit

402fe71

1 Parent(s): 3757039

app.py

Browse files

Files changed (1) hide show

app.py +59 -55

app.py CHANGED Viewed

@@ -11,6 +11,20 @@ from utils.prompt_utils import remove_color
 from utils.tagger import modelLoad, analysis
 def load_model(lora_dir, cn_dir):
     device = "cuda" if torch.cuda.is_available() else "cpu"
     dtype = torch.float16
@@ -29,30 +43,49 @@ def load_model(lora_dir, cn_dir):
     return pipe
 class Img2Img:
     def __init__(self):
         self.setup_paths()
         self.setup_models()
         self.post_filter = True
         self.tagger_model = None
         self.input_image_path = None
-    def setup_paths(self):
-        self.path = os.getcwd()
-        self.cn_dir = f"{self.path}/controlnet"
-        self.tagger_dir = f"{self.path}/tagger"
-        self.lora_dir = f"{self.path}/lora"
-        os.makedirs(self.cn_dir, exist_ok=True)
-        os.makedirs(self.tagger_dir, exist_ok=True)
-        os.makedirs(self.lora_dir, exist_ok=True)
-    def setup_models(self):
-        load_cn_model(self.cn_dir)
-        load_cn_config(self.cn_dir)
-        load_tagger_model(self.tagger_dir)
-        load_lora_model(self.lora_dir)
     def process_prompt_analysis(self, input_image_path):
         if self.tagger_model is None:
             self.tagger_model = modelLoad(self.tagger_dir)
@@ -63,7 +96,7 @@ class Img2Img:
         return tags_list
-    def launch(self):
         css = """
         #intro{
             max-width: 32rem;
@@ -77,8 +110,11 @@ class Img2Img:
                     self.input_image_path = gr.Image(label="input_image", type='filepath')
                     self.prompt = gr.Textbox(label="prompt", lines=3)
                     self.negative_prompt = gr.Textbox(label="negative_prompt", lines=3, value="lowres, error, extra digit, fewer digits, cropped, worst quality,low quality, normal quality, jpeg artifacts, blurry")
                     prompt_analysis_button = gr.Button("prompt解析")
                     self.controlnet_scale = gr.Slider(minimum=0.5, maximum=1.25, value=1.0, step=0.01, label="線画忠実度")
                     generate_button = gr.Button("生成")
                 with gr.Column():
                     self.output_image = gr.Image(type="pil", label="出力画像")
@@ -96,41 +132,9 @@ class Img2Img:
                 inputs=[self.input_image_path, self.prompt, self.negative_prompt, self.controlnet_scale],
                 outputs=self.output_image
             )
-        self.demo.queue()
-        self.demo.launch(share=True)
-    @spaces.GPU
-    def predict(self, input_image_path, prompt, negative_prompt, controlnet_scale):
-        pipe = load_model(self.lora_dir, self.cn_dir)
-        input_image_pil = Image.open(input_image_path)
-        base_size = input_image_pil.size
-        resize_image = resize_image_aspect_ratio(input_image_pil)
-        resize_image_size = resize_image.size
-        width, height = resize_image_size
-        white_base_pil = base_generation(resize_image.size, (255, 255, 255, 255)).convert("RGB")
-        generator = torch.manual_seed(0)
-        last_time = time.time()
-        output_image = pipe(
-            image=white_base_pil,
-            control_image=resize_image,
-            strength=1.0,
-            prompt=prompt,
-            negative_prompt=negative_prompt,
-            width=width,
-            height=height,
-            controlnet_conditioning_scale=float(controlnet_scale),
-            controlnet_start=0.0,
-            controlnet_end=1.0,
-            generator=generator,
-            num_inference_steps=30,
-            guidance_scale=8.5,
-            eta=1.0,
-        ).images[0]
-        print(f"Time taken: {time.time() - last_time}")
-        output_image = output_image.resize(base_size, Image.LANCZOS)
-        return output_image
-if __name__ == "__main__":
-    ui = Img2Img()
-    ui.launch()

 from utils.tagger import modelLoad, analysis
+path = os.getcwd()
+cn_dir = f"{path}/controlnet"
+tagger_dir = f"{path}/tagger"
+lora_dir = f"{path}/lora"
+os.makedirs(cn_dir, exist_ok=True)
+os.makedirs(tagger_dir, exist_ok=True)
+os.makedirs(lora_dir, exist_ok=True)
+load_cn_model(cn_dir)
+load_cn_config(cn_dir)
+load_tagger_model(tagger_dir)
+load_lora_model(lora_dir)
 def load_model(lora_dir, cn_dir):
     device = "cuda" if torch.cuda.is_available() else "cpu"
     dtype = torch.float16
     return pipe
+@spaces.GPU
+def predict(input_image_path, prompt, negative_prompt, controlnet_scale):
+    pipe = load_model(lora_dir, cn_dir)
+    input_image_pil = Image.open(input_image_path)
+    base_size = input_image_pil.size
+    resize_image = resize_image_aspect_ratio(input_image_pil)
+    resize_image_size = resize_image.size
+    width, height = resize_image_size
+    white_base_pil = base_generation(resize_image.size, (255, 255, 255, 255)).convert("RGB")
+    generator = torch.manual_seed(0)
+    last_time = time.time()
+    output_image = pipe(
+        image=white_base_pil,
+        control_image=resize_image,
+        strength=1.0,
+        prompt=prompt,
+        negative_prompt = negative_prompt,
+        width=width,
+        height=height,
+        controlnet_conditioning_scale=float(controlnet_scale),
+        controlnet_start=0.0,
+        controlnet_end=1.0,
+        generator=generator,
+        num_inference_steps=30,
+        guidance_scale=8.5,
+        eta=1.0,
+    ).images[0]
+    print(f"Time taken: {time.time() - last_time}")
+    output_image = output_image.resize(base_size, Image.LANCZOS)
+    return output_image
 class Img2Img:
     def __init__(self):
         self.setup_paths()
         self.setup_models()
+        self.demo = self.layout()
         self.post_filter = True
         self.tagger_model = None
         self.input_image_path = None
     def process_prompt_analysis(self, input_image_path):
         if self.tagger_model is None:
             self.tagger_model = modelLoad(self.tagger_dir)
         return tags_list
+    def layout(self):
         css = """
         #intro{
             max-width: 32rem;
                     self.input_image_path = gr.Image(label="input_image", type='filepath')
                     self.prompt = gr.Textbox(label="prompt", lines=3)
                     self.negative_prompt = gr.Textbox(label="negative_prompt", lines=3, value="lowres, error, extra digit, fewer digits, cropped, worst quality,low quality, normal quality, jpeg artifacts, blurry")
                     prompt_analysis_button = gr.Button("prompt解析")
                     self.controlnet_scale = gr.Slider(minimum=0.5, maximum=1.25, value=1.0, step=0.01, label="線画忠実度")
                     generate_button = gr.Button("生成")
                 with gr.Column():
                     self.output_image = gr.Image(type="pil", label="出力画像")
                 inputs=[self.input_image_path, self.prompt, self.negative_prompt, self.controlnet_scale],
                 outputs=self.output_image
             )
+        return demo
+img2img = Img2Img()
+img2img.demo.launch(share=True)