Spaces:

DHEIVER
/

prompt.ai

Runtime error

App Files Files Community

DHEIVER commited on Dec 7, 2024

Commit

d3aa270

verified ·

1 Parent(s): b974190

Update app.py

Browse files

Files changed (1) hide show

app.py +14 -6

app.py CHANGED Viewed

@@ -69,8 +69,9 @@ TEMPLATES = {
     }
 }
 class EnhancedPromptGenerator:
-    def __init__(self, model_name: str = "beomi/llama-2-ko-7b"):
         self.model_name = model_name
         self.load_model()
@@ -83,7 +84,7 @@ class EnhancedPromptGenerator:
                 use_fast=True
             )
             self.model = AutoModelForCausalLM.from_pretrained(
-                self.model_name,
                 torch_dtype=torch.float16,
                 device_map="auto",
                 low_cpu_mem_usage=True
@@ -94,9 +95,14 @@ class EnhancedPromptGenerator:
             raise
     def generate_with_model(self, prompt: str, config: PromptConfig = PromptConfig()) -> str:
-        """Gera texto usando o modelo com configurações avançadas"""
         try:
-            inputs = self.tokenizer(prompt, return_tensors="pt").to(self.model.device)
             outputs = self.model.generate(
                 **inputs,
@@ -105,7 +111,9 @@ class EnhancedPromptGenerator:
                 top_p=config.top_p,
                 repetition_penalty=config.repetition_penalty,
                 do_sample=True,
-                pad_token_id=self.tokenizer.eos_token_id
             )
             return self.tokenizer.decode(outputs[0], skip_special_tokens=True)
@@ -113,7 +121,7 @@ class EnhancedPromptGenerator:
         except Exception as e:
             logging.error(f"Erro na geração: {e}")
             return f"Erro na geração: {str(e)}"
 generator = EnhancedPromptGenerator()
 def get_suggestions(categoria: str, subcategoria: str) -> List[str]:

     }
 }
+# Mudança principal na classe do gerador para usar um modelo mais leve
 class EnhancedPromptGenerator:
+    def __init__(self, model_name: str = "neuralmind/bert-base-portuguese-cased"):
         self.model_name = model_name
         self.load_model()
                 use_fast=True
             )
             self.model = AutoModelForCausalLM.from_pretrained(
+                "microsoft/phi-2",  # Modelo mais leve e eficiente
                 torch_dtype=torch.float16,
                 device_map="auto",
                 low_cpu_mem_usage=True
             raise
     def generate_with_model(self, prompt: str, config: PromptConfig = PromptConfig()) -> str:
+        """Gera texto usando o modelo com configurações otimizadas"""
         try:
+            # Adiciona contexto em português
+            enhanced_prompt = f"""
+            Por favor, gere um texto em português de acordo com as instruções:
+            {prompt}
+            """
+            inputs = self.tokenizer(enhanced_prompt, return_tensors="pt").to(self.model.device)
             outputs = self.model.generate(
                 **inputs,
                 top_p=config.top_p,
                 repetition_penalty=config.repetition_penalty,
                 do_sample=True,
+                pad_token_id=self.tokenizer.eos_token_id,
+                num_beams=4,  # Melhor qualidade para português
+                early_stopping=True
             )
             return self.tokenizer.decode(outputs[0], skip_special_tokens=True)
         except Exception as e:
             logging.error(f"Erro na geração: {e}")
             return f"Erro na geração: {str(e)}"
 generator = EnhancedPromptGenerator()
 def get_suggestions(categoria: str, subcategoria: str) -> List[str]: