jla25
/

squareV3

Transformers

Safetensors

m2m_100

text2text-generation

Model card Files Files and versions Community

jla25 commited on Nov 18, 2024

Commit

a87db35

verified ·

1 Parent(s): 0dd4228

Update handler.py

Browse files

Files changed (1) hide show

handler.py +9 -11

handler.py CHANGED Viewed

@@ -4,36 +4,34 @@ import json
 class EndpointHandler:
     def __init__(self, model_dir):
-        # Cargar el modelo y el tokenizador desde el directorio del modelo
         self.tokenizer = AutoTokenizer.from_pretrained(model_dir)
         self.model = AutoModelForSeq2SeqLM.from_pretrained(model_dir)
-        self.model.eval()  # Configurar el modelo en modo de evaluación
     def preprocess(self, data):
-        # Preprocesamiento de la entrada
-        if isinstance(data, dict) and "inputs" in data:
-            input_text = "Generate a valid JSON capturing data from this text: " + data["inputs"]
-        else:
-            raise ValueError("Esperando un diccionario con la clave 'inputs'")
         # Tokenización de la entrada
         tokens = self.tokenizer(input_text, return_tensors="pt", truncation=True, padding=True)
         return tokens
     def inference(self, tokens):
-        # Realizar la inferencia
         with torch.no_grad():
             outputs = self.model.generate(**tokens)
         return outputs
     def postprocess(self, outputs):
-        # Decodificar la salida del modelo
         decoded_output = self.tokenizer.decode(outputs[0], skip_special_tokens=True)
         return {"generated_text": decoded_output}
     def __call__(self, data):
-        # Llamada principal del handler para procesamiento completo
         tokens = self.preprocess(data)
         outputs = self.inference(tokens)
         result = self.postprocess(outputs)
-        return result

 class EndpointHandler:
     def __init__(self, model_dir):
         self.tokenizer = AutoTokenizer.from_pretrained(model_dir)
         self.model = AutoModelForSeq2SeqLM.from_pretrained(model_dir)
+        self.model.eval()
     def preprocess(self, data):
+        # Validar entrada
+        if not data or not isinstance(data, dict) or "inputs" not in data or data["inputs"] is None:
+            raise ValueError("La entrada debe ser un diccionario con la clave 'inputs' y un valor válido")
+        input_text = "Generate a valid JSON capturing data from this text: " + data["inputs"]
+        if not input_text.strip():
+            raise ValueError("El texto de entrada no puede estar vacío")
         # Tokenización de la entrada
         tokens = self.tokenizer(input_text, return_tensors="pt", truncation=True, padding=True)
         return tokens
     def inference(self, tokens):
         with torch.no_grad():
             outputs = self.model.generate(**tokens)
         return outputs
     def postprocess(self, outputs):
         decoded_output = self.tokenizer.decode(outputs[0], skip_special_tokens=True)
         return {"generated_text": decoded_output}
     def __call__(self, data):
         tokens = self.preprocess(data)
         outputs = self.inference(tokens)
         result = self.postprocess(outputs)
+        return result