Spaces:

SandeepU
/

code-explainer-c

Sleeping

SandeepU commited on Jun 24

Commit

db97ee5

verified ·

1 Parent(s): bf2c260

Upload model_utils.py

Files changed (1) hide show

model/model_utils.py CHANGED Viewed

@@ -2,7 +2,7 @@ from transformers import AutoTokenizer, T5ForConditionalGeneration
 import torch
 def load_model():
-    model_name = "Salesforce/codet5-small"
     tokenizer = AutoTokenizer.from_pretrained(model_name)
     model = T5ForConditionalGeneration.from_pretrained(model_name)
     model.eval()
@@ -11,7 +11,8 @@ def load_model():
 def generate_explanation(code, tokenizer, model):
     device = model.device
-    input_text = "summarize: " + code
     input_ids = tokenizer.encode(input_text, return_tensors="pt", truncation=True).to(device)
-    output = model.generate(input_ids, max_new_tokens=150, early_stopping=True)
     return tokenizer.decode(output[0], skip_special_tokens=True)

 import torch
 def load_model():
+    model_name = "Salesforce/codet5-base-multi-sum"
     tokenizer = AutoTokenizer.from_pretrained(model_name)
     model = T5ForConditionalGeneration.from_pretrained(model_name)
     model.eval()
 def generate_explanation(code, tokenizer, model):
     device = model.device
+    # Better prompt engineering
+    input_text = f"summarize: This Python function does the following: {code}"
     input_ids = tokenizer.encode(input_text, return_tensors="pt", truncation=True).to(device)
+    output = model.generate(input_ids, max_new_tokens=200, early_stopping=True)
     return tokenizer.decode(output[0], skip_special_tokens=True)