nanda

Runtime error

App Files Files Community

vcollos commited on Mar 21

Commit

605c374

verified ·

1 Parent(s): 1089574

Update app.py

Browse files

Files changed (1) hide show

app.py +98 -41

app.py CHANGED Viewed

@@ -41,17 +41,21 @@ pipe = DiffusionPipeline.from_pretrained(
 # Move o modelo para GPU
 pipe.to("cuda")
-# Definição dos LoRA e Trigger Words
 lora_models = {
     "Paula": {
         "repo": "vcollos/Paula2",
         "weights": "Paula P.safetensors",
-        "trigger_word": "paula, woman with long blonde hair"  # Trigger word para Paula (mulher)
     },
     "Vivi": {
         "repo": "vcollos/Vivi",
         "weights": "Vivi.safetensors",
-        "trigger_word": "vivi, man with dark hair"  # Trigger word para Vivi (homem)
     }
 }
@@ -92,22 +96,38 @@ def optimize_with_openai(text, character_option):
     try:
         # Determina o prompt de sistema com base na seleção de personagem
         if character_option == "Paula":
-            system_prompt = """Você é um especialista em criar prompts para o modelo de imagem FLUX.1-dev.
             Traduza e otimize este prompt em português para um prompt em inglês que irá gerar
-            uma imagem de uma mulher loira chamada Paula. Seu prompt deve ser detalhado, claro e
-            enfatizar características de uma mulher loira.
             Responda APENAS com o prompt otimizado em inglês, sem explicações ou introduções."""
         elif character_option == "Vivi":
-            system_prompt = """Você é um especialista em criar prompts para o modelo de imagem FLUX.1-dev.
             Traduza e otimize este prompt em português para um prompt em inglês que irá gerar
-            uma imagem de um homem de cabelo escuro chamado Vivi. Seu prompt deve ser detalhado, claro e
-            enfatizar características de um homem moreno.
             Responda APENAS com o prompt otimizado em inglês, sem explicações ou introduções."""
         else:  # both
-            system_prompt = """Você é um especialista em criar prompts para o modelo de imagem FLUX.1-dev.
             Traduza e otimize este prompt em português para um prompt em inglês que irá gerar
             uma imagem de duas pessoas juntas: uma mulher loira chamada Paula e um homem de cabelo escuro chamado Vivi.
             Seu prompt deve ser detalhado, claro e deve enfatizar a presença dos DOIS personagens na mesma cena.
             Responda APENAS com o prompt otimizado em inglês, sem explicações ou introduções."""
         # Configuração do cabeçalho e corpo da requisição
@@ -152,22 +172,38 @@ def optimize_with_google_ai(text, character_option):
     try:
         # Determina o prompt com base na seleção de personagem
         if character_option == "Paula":
-            instruction = """Você é um especialista em criar prompts para modelos de imagem AI.
             Traduza e otimize este prompt em português para um prompt em inglês que irá gerar
-            uma imagem de uma mulher loira chamada Paula. Seu prompt deve ser detalhado, claro e
-            enfatizar características de uma mulher loira.
             Responda APENAS com o prompt otimizado em inglês, sem explicações ou introduções."""
         elif character_option == "Vivi":
-            instruction = """Você é um especialista em criar prompts para modelos de imagem AI.
             Traduza e otimize este prompt em português para um prompt em inglês que irá gerar
-            uma imagem de um homem de cabelo escuro chamado Vivi. Seu prompt deve ser detalhado, claro e
-            enfatizar características de um homem moreno.
             Responda APENAS com o prompt otimizado em inglês, sem explicações ou introduções."""
         else:  # both
-            instruction = """Você é um especialista em criar prompts para modelos de imagem AI.
             Traduza e otimize este prompt em português para um prompt em inglês que irá gerar
             uma imagem de duas pessoas juntas: uma mulher loira chamada Paula e um homem de cabelo escuro chamado Vivi.
             Seu prompt deve ser detalhado, claro e deve enfatizar a presença dos DOIS personagens na mesma cena.
             Responda APENAS com o prompt otimizado em inglês, sem explicações ou introduções."""
         # Prepara a requisição para a API do Google Gemini
@@ -212,7 +248,7 @@ def optimize_with_google_ai(text, character_option):
         return optimize_with_openai(text, character_option)
 @spaces.GPU(duration=80)
-def run_lora(prompt, cfg_scale, steps, randomize_seed, seed, width, height, lora_option, lora_scale_1, lora_scale_2, lora_balance, ai_option, progress=gr.Progress(track_tqdm=True)):
     if randomize_seed:
         seed = random.randint(0, MAX_SEED)
     generator = torch.Generator(device="cuda").manual_seed(seed)
@@ -243,17 +279,24 @@ def run_lora(prompt, cfg_scale, steps, randomize_seed, seed, width, height, lora
     # Define qual LoRA usar com base na seleção do usuário
     selected_loras = []
     adapter_weights = []
-    # Modificado para melhorar a mescla de personagens
     if lora_option == "Paula":
         selected_loras.append("Paula")
         adapter_weights.append(lora_scale_1)
-        prompt = f"{lora_models['Paula']['trigger_word']} {prompt}"
     elif lora_option == "Vivi":
         selected_loras.append("Vivi")
         adapter_weights.append(lora_scale_2)
-        prompt = f"{lora_models['Vivi']['trigger_word']} {prompt}"
     elif lora_option == "Ambos":
         # Usa o balance slider para ajustar a proporção entre os dois LoRAs
@@ -263,16 +306,21 @@ def run_lora(prompt, cfg_scale, steps, randomize_seed, seed, width, height, lora
         selected_loras = ["Paula", "Vivi"]
         adapter_weights = [p_weight, v_weight]
-        # Quando usando ambos, adiciona trigger words específicas para cada personagem
-        # e ajusta o prompt para indicar que ambos devem aparecer na mesma cena
-        prompt = f"{lora_models['Paula']['trigger_word']} and {lora_models['Vivi']['trigger_word']} together, a woman and a man, {prompt}"
     pipe.set_adapters(selected_loras, adapter_weights)
     # Gera a imagem com precisão de 16 bits
     with torch.autocast("cuda"):
         image = pipe(
             prompt=prompt,
             num_inference_steps=steps,
             guidance_scale=cfg_scale,
             width=width,
@@ -300,6 +348,7 @@ def run_lora(prompt, cfg_scale, steps, randomize_seed, seed, width, height, lora
             "prompt": original_prompt,  # Salva o prompt original
             "processed_prompt": processed_prompt,  # Salva o prompt processado pela IA
             "full_prompt": prompt,      # Salva o prompt completo com trigger words
             "ai_option": ai_option,
             "cfg_scale": cfg_scale,
             "steps": steps,
@@ -333,8 +382,8 @@ with gr.Blocks(theme=gr_theme) as app:
             generate_button = gr.Button("Gerar")
             with gr.Accordion("Configurações Básicas", open=True):
-                cfg_scale = gr.Slider(label="CFG Scale", minimum=1, maximum=20, step=0.5, value=3.5)
-                steps = gr.Slider(label="Steps", minimum=1, maximum=100, step=1, value=32)
                 width = gr.Slider(label="Width", minimum=256, maximum=1024, step=64, value=768)
                 height = gr.Slider(label="Height", minimum=256, maximum=1024, step=64, value=1024)
                 randomize_seed = gr.Checkbox(False, label="Randomize seed")
@@ -342,10 +391,11 @@ with gr.Blocks(theme=gr_theme) as app:
             with gr.Accordion("Configurações de LoRA", open=True):
                 lora_option = gr.Radio(["Nenhum", "Paula", "Vivi", "Ambos"], label="Escolha o LoRA", value="Ambos")
-                lora_scale_1 = gr.Slider(label="LoRA Scale (Paula)", minimum=0, maximum=1, step=0.01, value=0.8)
-                lora_scale_2 = gr.Slider(label="LoRA Scale (Vivi)", minimum=0, maximum=1, step=0.01, value=0.8)
                 lora_balance = gr.Slider(label="Balanço entre personagens", minimum=0.5, maximum=1.5, step=0.05, value=1.0,
                                          info="Valores acima de 1.0 favorecem Paula, abaixo de 1.0 favorecem Vivi")
             with gr.Accordion("Processamento de Prompt", open=True):
                 ai_option = gr.Radio(
@@ -358,24 +408,31 @@ with gr.Blocks(theme=gr_theme) as app:
             result = gr.Image(label="Generated Image")
             final_prompt = gr.Textbox(label="Prompt Final (usado para gerar a imagem)", lines=3)
             gr.Markdown("""
-            ### Como funciona:
-            1. Escreva seu prompt em português
-            2. Escolha entre Google AI (recomendado) ou OpenAI para traduzir e otimizar seu prompt
-            3. O sistema irá transformar sua descrição em português em um prompt profissional em inglês
-            4. O prompt será específico para o(s) personagem(ns) selecionado(s)
-            ### Dicas para gerar imagens com ambos personagens:
-            1. Use o modo "Ambos" com valores balanceados (ex: 0.8 para ambos os LoRAs)
-            2. Inclua no prompt termos como "um homem e uma mulher juntos", "um casal", etc.
-            3. Lembre-se: Paula é uma mulher loira e Vivi é um homem de cabelo escuro
-            4. Ajuste o Balanço para favorecer um personagem ou outro se necessário
-            5. A otimização via IA produzirá melhores resultados do que prompts diretos
-            6. Experimente com seeds diferentes até encontrar uma que funcione bem
             """)
     generate_button.click(
         run_lora,
-        inputs=[prompt, cfg_scale, steps, randomize_seed, seed, width, height, lora_option, lora_scale_1, lora_scale_2, lora_balance, ai_option],
         outputs=[result, seed, final_prompt],
     )

 # Move o modelo para GPU
 pipe.to("cuda")
+# Definição dos LoRA e Trigger Words - Melhoradas para caracterização mais forte
 lora_models = {
     "Paula": {
         "repo": "vcollos/Paula2",
         "weights": "Paula P.safetensors",
+        "trigger_word": "woman with long blonde hair named Paula",
+        "negative_word": "men, male, man, masculine features, dark hair",
+        "character_desc": "a beautiful woman with long blonde hair, feminine features, soft facial features"
     },
     "Vivi": {
         "repo": "vcollos/Vivi",
         "weights": "Vivi.safetensors",
+        "trigger_word": "man with dark hair named Vivi",
+        "negative_word": "women, female, woman, feminine features, blonde hair",
+        "character_desc": "a handsome man with dark hair, masculine features, defined jawline"
     }
 }
     try:
         # Determina o prompt de sistema com base na seleção de personagem
         if character_option == "Paula":
+            system_prompt = f"""Você é um especialista em criar prompts para o modelo de imagem FLUX.1-dev.
             Traduza e otimize este prompt em português para um prompt em inglês que irá gerar
+            uma imagem de uma mulher loira chamada Paula.
+            Descrição de Paula: {lora_models['Paula']['character_desc']}
+            Seu prompt deve ser detalhado, claro e enfatizar características de uma mulher loira.
+            Inclua aspectos como: cabelo loiro, características femininas, expressão facial.
             Responda APENAS com o prompt otimizado em inglês, sem explicações ou introduções."""
         elif character_option == "Vivi":
+            system_prompt = f"""Você é um especialista em criar prompts para o modelo de imagem FLUX.1-dev.
             Traduza e otimize este prompt em português para um prompt em inglês que irá gerar
+            uma imagem de um homem de cabelo escuro chamado Vivi.
+            Descrição de Vivi: {lora_models['Vivi']['character_desc']}
+            Seu prompt deve ser detalhado, claro e enfatizar características masculinas e cabelo escuro.
+            Inclua aspectos como: cabelo escuro, características masculinas, expressão facial.
             Responda APENAS com o prompt otimizado em inglês, sem explicações ou introduções."""
         else:  # both
+            system_prompt = f"""Você é um especialista em criar prompts para o modelo de imagem FLUX.1-dev.
             Traduza e otimize este prompt em português para um prompt em inglês que irá gerar
             uma imagem de duas pessoas juntas: uma mulher loira chamada Paula e um homem de cabelo escuro chamado Vivi.
+            Descrição de Paula: {lora_models['Paula']['character_desc']}
+            Descrição de Vivi: {lora_models['Vivi']['character_desc']}
             Seu prompt deve ser detalhado, claro e deve enfatizar a presença dos DOIS personagens na mesma cena.
+            IMPORTANTE: Mencione AMBOS os personagens de forma clara e distinta, enfatizando suas diferenças (homem/mulher, cabelo escuro/loiro).
             Responda APENAS com o prompt otimizado em inglês, sem explicações ou introduções."""
         # Configuração do cabeçalho e corpo da requisição
     try:
         # Determina o prompt com base na seleção de personagem
         if character_option == "Paula":
+            instruction = f"""Você é um especialista em criar prompts para modelos de imagem AI.
             Traduza e otimize este prompt em português para um prompt em inglês que irá gerar
+            uma imagem de uma mulher loira chamada Paula.
+            Descrição de Paula: {lora_models['Paula']['character_desc']}
+            Seu prompt deve ser detalhado, claro e enfatizar características de uma mulher loira.
+            Inclua aspectos como: cabelo loiro, características femininas, expressão facial.
             Responda APENAS com o prompt otimizado em inglês, sem explicações ou introduções."""
         elif character_option == "Vivi":
+            instruction = f"""Você é um especialista em criar prompts para modelos de imagem AI.
             Traduza e otimize este prompt em português para um prompt em inglês que irá gerar
+            uma imagem de um homem de cabelo escuro chamado Vivi.
+            Descrição de Vivi: {lora_models['Vivi']['character_desc']}
+            Seu prompt deve ser detalhado, claro e enfatizar características masculinas e cabelo escuro.
+            Inclua aspectos como: cabelo escuro, características masculinas, expressão facial.
             Responda APENAS com o prompt otimizado em inglês, sem explicações ou introduções."""
         else:  # both
+            instruction = f"""Você é um especialista em criar prompts para modelos de imagem AI.
             Traduza e otimize este prompt em português para um prompt em inglês que irá gerar
             uma imagem de duas pessoas juntas: uma mulher loira chamada Paula e um homem de cabelo escuro chamado Vivi.
+            Descrição de Paula: {lora_models['Paula']['character_desc']}
+            Descrição de Vivi: {lora_models['Vivi']['character_desc']}
             Seu prompt deve ser detalhado, claro e deve enfatizar a presença dos DOIS personagens na mesma cena.
+            IMPORTANTE: Mencione AMBOS os personagens de forma clara e distinta, enfatizando suas diferenças (homem/mulher, cabelo escuro/loiro).
             Responda APENAS com o prompt otimizado em inglês, sem explicações ou introduções."""
         # Prepara a requisição para a API do Google Gemini
         return optimize_with_openai(text, character_option)
 @spaces.GPU(duration=80)
+def run_lora(prompt, cfg_scale, steps, randomize_seed, seed, width, height, lora_option, lora_scale_1, lora_scale_2, lora_balance, ai_option, use_negative_prompt, progress=gr.Progress(track_tqdm=True)):
     if randomize_seed:
         seed = random.randint(0, MAX_SEED)
     generator = torch.Generator(device="cuda").manual_seed(seed)
     # Define qual LoRA usar com base na seleção do usuário
     selected_loras = []
     adapter_weights = []
+    negative_prompt = ""
+    # Modificado para melhorar a caracterização de personagens
     if lora_option == "Paula":
         selected_loras.append("Paula")
         adapter_weights.append(lora_scale_1)
+        # Adiciona mais ênfase no personagem e suas características
+        prompt = f"{lora_models['Paula']['trigger_word']}, {lora_models['Paula']['character_desc']}, {prompt}"
+        if use_negative_prompt:
+            negative_prompt = lora_models['Paula']['negative_word']
     elif lora_option == "Vivi":
         selected_loras.append("Vivi")
         adapter_weights.append(lora_scale_2)
+        # Adiciona mais ênfase no personagem e suas características
+        prompt = f"{lora_models['Vivi']['trigger_word']}, {lora_models['Vivi']['character_desc']}, {prompt}"
+        if use_negative_prompt:
+            negative_prompt = lora_models['Vivi']['negative_word']
     elif lora_option == "Ambos":
         # Usa o balance slider para ajustar a proporção entre os dois LoRAs
         selected_loras = ["Paula", "Vivi"]
         adapter_weights = [p_weight, v_weight]
+        # Quando usando ambos, adiciona descrições mais explícitas para cada personagem
+        prompt = f"{lora_models['Paula']['trigger_word']} and {lora_models['Vivi']['trigger_word']} together, side by side, a blonde woman and a dark-haired man, {prompt}"
     pipe.set_adapters(selected_loras, adapter_weights)
+    # Adiciona log para depuração
+    logger.info(f"Prompt Final: {prompt}")
+    logger.info(f"Negative Prompt: {negative_prompt}")
+    logger.info(f"LoRA selecionado: {lora_option}, Pesos: {adapter_weights}")
     # Gera a imagem com precisão de 16 bits
     with torch.autocast("cuda"):
         image = pipe(
             prompt=prompt,
+            negative_prompt=negative_prompt,
             num_inference_steps=steps,
             guidance_scale=cfg_scale,
             width=width,
             "prompt": original_prompt,  # Salva o prompt original
             "processed_prompt": processed_prompt,  # Salva o prompt processado pela IA
             "full_prompt": prompt,      # Salva o prompt completo com trigger words
+            "negative_prompt": negative_prompt,
             "ai_option": ai_option,
             "cfg_scale": cfg_scale,
             "steps": steps,
             generate_button = gr.Button("Gerar")
             with gr.Accordion("Configurações Básicas", open=True):
+                cfg_scale = gr.Slider(label="CFG Scale", minimum=1, maximum=20, step=0.5, value=7.5)
+                steps = gr.Slider(label="Steps", minimum=1, maximum=100, step=1, value=30)
                 width = gr.Slider(label="Width", minimum=256, maximum=1024, step=64, value=768)
                 height = gr.Slider(label="Height", minimum=256, maximum=1024, step=64, value=1024)
                 randomize_seed = gr.Checkbox(False, label="Randomize seed")
             with gr.Accordion("Configurações de LoRA", open=True):
                 lora_option = gr.Radio(["Nenhum", "Paula", "Vivi", "Ambos"], label="Escolha o LoRA", value="Ambos")
+                lora_scale_1 = gr.Slider(label="LoRA Scale (Paula)", minimum=0, maximum=1, step=0.01, value=0.85)
+                lora_scale_2 = gr.Slider(label="LoRA Scale (Vivi)", minimum=0, maximum=1, step=0.01, value=0.85)
                 lora_balance = gr.Slider(label="Balanço entre personagens", minimum=0.5, maximum=1.5, step=0.05, value=1.0,
                                          info="Valores acima de 1.0 favorecem Paula, abaixo de 1.0 favorecem Vivi")
+                use_negative_prompt = gr.Checkbox(True, label="Usar negative prompt", info="Ajuda a evitar mistura de características")
             with gr.Accordion("Processamento de Prompt", open=True):
                 ai_option = gr.Radio(
             result = gr.Image(label="Generated Image")
             final_prompt = gr.Textbox(label="Prompt Final (usado para gerar a imagem)", lines=3)
             gr.Markdown("""
+            ### Como melhorar a identidade de cada personagem:
+            1. **Para apenas Paula (mulher loira)**:
+               - Use CFG Scale mais alto (7-9)
+               - LoRA Scale para Paula em 0.85-0.95
+               - Mantenha o "Usar negative prompt" ativado
+               - Mencione explicitamente "mulher loira" no prompt
+            2. **Para apenas Vivi (homem de cabelo escuro)**:
+               - Use CFG Scale mais alto (7-9)
+               - LoRA Scale para Vivi em 0.85-0.95
+               - Mantenha o "Usar negative prompt" ativado
+               - Mencione explicitamente "homem de cabelo escuro" no prompt
+            3. **Para ambos juntos**:
+               - Use o modo "Ambos" com valores iguais para os dois LoRAs
+               - Descreva claramente uma "mulher loira e um homem de cabelo escuro" no prompt
+               - Use uma seed que funcione bem (teste várias)
+               - Um CFG Scale entre 7-8 costuma dar bons resultados
+               - Especifique que eles estão "lado a lado" ou "juntos na mesma cena"
             """)
     generate_button.click(
         run_lora,
+        inputs=[prompt, cfg_scale, steps, randomize_seed, seed, width, height, lora_option, lora_scale_1, lora_scale_2, lora_balance, ai_option, use_negative_prompt],
         outputs=[result, seed, final_prompt],
     )