aarohanverma
/

text2sql-flan-t5-base-qlora-finetuned

Text2Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

aarohanverma commited on 6 days ago

Commit

de0a177

·

verified ·

1 Parent(s): 32aace6

Update README.md

Files changed (1) hide show

README.md +6 -7

README.md CHANGED Viewed

@@ -226,17 +226,16 @@ def run_inference(prompt_text: str) -> str:
     generated_ids = model.generate(
         input_ids=inputs["input_ids"],
-        decoder_start_token_id=model.config.decoder_start_token_id,  # ✅ Ensure decoder start token
-        max_new_tokens=100,  # ✅ Limit to prevent excessive output
-        temperature=0.1,  # ✅ Adds slight randomness to avoid repetition
-        num_beams=5,  # ✅ Increases quality
-        repetition_penalty=1.2,  # ✅ Penalizes repetition
-        early_stopping=True,  # ✅ Stops generation once complete
     )
     generated_sql = tokenizer.decode(generated_ids[0], skip_special_tokens=True)
-    # ✅ Post-processing to remove repeated text
     generated_sql = generated_sql.split(";")[0] + ";"  # Keep only the first valid SQL query
     return generated_sql

     generated_ids = model.generate(
         input_ids=inputs["input_ids"],
+        decoder_start_token_id=model.config.decoder_start_token_id,
+        max_new_tokens=100,
+        temperature=0.1,
+        num_beams=5,
+        repetition_penalty=1.2,
+        early_stopping=True,
     )
     generated_sql = tokenizer.decode(generated_ids[0], skip_special_tokens=True)
     generated_sql = generated_sql.split(";")[0] + ";"  # Keep only the first valid SQL query
     return generated_sql