Spaces:

tahiryaqoob
/

testbot

Sleeping

tahiryaqoob commited on Dec 16, 2024

Commit

9b4ed7e

verified ·

1 Parent(s): e0ce4e1

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -11,10 +11,14 @@ model_name = "microsoft/DialoGPT-medium"
 tokenizer = AutoTokenizer.from_pretrained(model_name)
 model = AutoModelForCausalLM.from_pretrained(model_name)
 # Fine-tuning Function
 def preprocess_data(example):
-    inputs = tokenizer(example['question'], truncation=True, padding=True, max_length=128)
-    outputs = tokenizer(example['answer'], truncation=True, padding=True, max_length=128)
     inputs['labels'] = outputs['input_ids']
     return inputs

 tokenizer = AutoTokenizer.from_pretrained(model_name)
 model = AutoModelForCausalLM.from_pretrained(model_name)
+# Assign Padding Token
+if tokenizer.pad_token is None:
+    tokenizer.pad_token = tokenizer.eos_token  # Use EOS token as padding token
 # Fine-tuning Function
 def preprocess_data(example):
+    inputs = tokenizer(example['question'], truncation=True, padding="max_length", max_length=128)
+    outputs = tokenizer(example['answer'], truncation=True, padding="max_length", max_length=128)
     inputs['labels'] = outputs['input_ids']
     return inputs