GiaPhu
/

Vietnamese-text-summarize-vit5-base

text2text-generation

text-generation-inference

Model card Files Files and versions

GiaPhu commited on Jun 2, 2024

Commit

5a26ca7

·

verified ·

1 Parent(s): 9337d23

Upload handler.py

Files changed (1) hide show

handler.py +27 -0

handler.py ADDED Viewed

	@@ -0,0 +1,27 @@

+from typing import Dict, Any, List
+import torch
+from transformers import AutoTokenizer, AutoModelForSeq2SeqLM
+class EndpointHandler():
+    def __init__(self, path=""):
+        self.device = 'cuda' if torch.cuda.is_available() else 'cpu'
+        try:
+            self.model = AutoModelForSeq2SeqLM.from_pretrained(path).to(self.device)
+            self.tokenizer = AutoTokenizer.from_pretrained(path)
+        except Exception as e:
+            print(f"Error loading model or tokenizer from path {path}: {e}")
+            # Handle error (e.g., exit or set model/tokenizer to None)
+    def __call__(self, data: Dict[str, Any]) -> List[Dict[str, Any]]:
+        inputs = data.get("inputs", "")
+        if not inputs:
+            return [{"error": "No inputs provided"}]
+        tokenized_input = self.tokenizer(inputs, return_tensors="pt")
+        input_ids,attention_masks = tokenized_input["input_ids"].to(self.device), tokenized_input["attention_mask"].to(self.device)  # Move input tensors to the same device as model
+        summary_ids = self.model.generate(input_ids=input_ids, attention_mask=attention_masks,)
+        summary_text = self.tokenizer.decode(summary_ids[0], skip_special_tokens=True,  clean_up_tokenization_spaces=True)
+        print('good')
+        return [{"summary": summary_text}]