Spaces:

fschwartzer
/

text_generation_with_feedback

Runtime error

fschwartzer commited on Jul 9, 2024

Commit

a200765

verified ·

1 Parent(s): 1ec6af9

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -19,9 +19,14 @@ df = pd.DataFrame(data)
 def answer_question_with_gpt(question):
     # Supondo que você queira incorporar dados do DataFrame na pergunta
     prompt = f"Considerando os dados: {df.to_string(index=False)}. Pergunta: {question} Resposta:"
-    input_ids = tokenizer.encode(prompt, return_tensors='pt')
-    max_length = len(input_ids[0]) + 50  # Define um limite máximo razoável para o comprimento da resposta
-    generated_ids = model.generate(input_ids, max_length=max_length)
     generated_text = tokenizer.decode(generated_ids[0], skip_special_tokens=True)
     return generated_text.split("Resposta:")[1] if "Resposta:" in generated_text else generated_text

 def answer_question_with_gpt(question):
     # Supondo que você queira incorporar dados do DataFrame na pergunta
     prompt = f"Considerando os dados: {df.to_string(index=False)}. Pergunta: {question} Resposta:"
+    inputs = tokenizer(prompt, return_tensors='pt', padding='max_length', truncation=True, max_length=512)
+    attention_mask = inputs['attention_mask']
+    input_ids = inputs['input_ids']
+    # Assegurando que o pad_token_id esteja definido corretamente para o modelo GPT-2
+    pad_token_id = tokenizer.eos_token_id  # GPT-2 usa o mesmo token para EOS e PAD
+    generated_ids = model.generate(input_ids, attention_mask=attention_mask, pad_token_id=pad_token_id, max_length=len(input_ids[0]) + 50)
     generated_text = tokenizer.decode(generated_ids[0], skip_special_tokens=True)
     return generated_text.split("Resposta:")[1] if "Resposta:" in generated_text else generated_text