jla25
/

squareV3

Text2Text Generation

Transformers

Safetensors

m2m_100

Model card Files Files and versions Community

jla25 commited on Nov 12, 2024

Commit

0d16e19

verified ·

1 Parent(s): 7504697

Create handler.py

Browse files

Files changed (1) hide show

handler.py +39 -0

handler.py ADDED Viewed

	@@ -0,0 +1,39 @@

+from transformers import AutoTokenizer, AutoModelForSeq2SeqLM
+import torch
+import json
+class EndpointHandler:
+    def __init__(self, model_dir):
+        # Cargar el modelo y el tokenizador desde el directorio del modelo
+        self.tokenizer = AutoTokenizer.from_pretrained(model_dir)
+        self.model = AutoModelForSeq2SeqLM.from_pretrained(model_dir)
+        self.model.eval()  # Configurar el modelo en modo de evaluación
+    def preprocess(self, data):
+        # Preprocesamiento de la entrada
+        if isinstance(data, dict) and "inputs" in data:
+            input_text = "Generate a valid JSON capturing data from this text: " + data["inputs"]
+        else:
+            raise ValueError("Esperando un diccionario con la clave 'inputs'")
+        # Tokenización de la entrada
+        tokens = self.tokenizer(input_text, return_tensors="pt", truncation=True, padding=True)
+        return tokens
+    def inference(self, tokens):
+        # Realizar la inferencia
+        with torch.no_grad():
+            outputs = self.model.generate(**tokens)
+        return outputs
+    def postprocess(self, outputs):
+        # Decodificar la salida del modelo
+        decoded_output = self.tokenizer.decode(outputs[0], skip_special_tokens=True)
+        return {"generated_text": decoded_output}
+    def __call__(self, data):
+        # Llamada principal del handler para procesamiento completo
+        tokens = self.preprocess(data)
+        outputs = self.inference(tokens)
+        result = self.postprocess(outputs)
+        return result