jla25
/

squareV3

jla25 commited on Nov 18, 2024

Commit

333ea63

verified ·

1 Parent(s): 4722f73

Update handler.py

Files changed (1) hide show

handler.py CHANGED Viewed

@@ -8,16 +8,17 @@ class EndpointHandler:
         self.model.eval()
     def preprocess(self, data):
         if not isinstance(data, dict) or "inputs" not in data or data["inputs"] is None:
             raise ValueError("La entrada debe ser un diccionario con la clave 'inputs' y un valor válido.")
         input_text = "Generate a valid JSON capturing data from this text: " + data["inputs"]
         tokens = self.tokenizer(input_text, return_tensors="pt", truncation=True, padding="max_length", max_length=1000)
-        if not tokens or not tokens["input_ids"]:
-            raise ValueError("Error al tokenizar el texto de entrada. Verifica el texto.")
         return tokens
     def inference(self, tokens):
         generate_kwargs = {
             "max_length": 1000,
             "num_beams": 5,
@@ -27,15 +28,15 @@ class EndpointHandler:
             "top_p": 0.9,
             "repetition_penalty": 2.5
         }
         with torch.no_grad():
             outputs = self.model.generate(**tokens, **generate_kwargs)
-        if outputs is None or len(outputs) == 0:
-            raise ValueError("El modelo no generó ninguna salida.")
         return outputs
     def postprocess(self, outputs):
         decoded_output = self.tokenizer.decode(outputs[0], skip_special_tokens=True)
-        return {"generated_text": decoded_output}
     def __call__(self, data):
         tokens = self.preprocess(data)

         self.model.eval()
     def preprocess(self, data):
+        # Validar la entrada
         if not isinstance(data, dict) or "inputs" not in data or data["inputs"] is None:
             raise ValueError("La entrada debe ser un diccionario con la clave 'inputs' y un valor válido.")
+        # Tokenizar el texto de entrada
         input_text = "Generate a valid JSON capturing data from this text: " + data["inputs"]
         tokens = self.tokenizer(input_text, return_tensors="pt", truncation=True, padding="max_length", max_length=1000)
         return tokens
     def inference(self, tokens):
+        # Parámetros de generación
         generate_kwargs = {
             "max_length": 1000,
             "num_beams": 5,
             "top_p": 0.9,
             "repetition_penalty": 2.5
         }
+        # Generar salida con el modelo
         with torch.no_grad():
             outputs = self.model.generate(**tokens, **generate_kwargs)
         return outputs
     def postprocess(self, outputs):
+        # Decodificar la salida generada
         decoded_output = self.tokenizer.decode(outputs[0], skip_special_tokens=True)
+        return {"response": decoded_output}
     def __call__(self, data):
         tokens = self.preprocess(data)