mideind
/

icelandic-gpt-sw3-6.7b-gec

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

gardarjuto commited on Mar 21, 2024

Commit

fc73940

•

1 Parent(s): eb01dd5

fix error about max_length

Files changed (1) hide show

handler.py +6 -5

handler.py CHANGED Viewed

@@ -34,7 +34,6 @@ class EndpointHandler:
             path, device_map="auto", torch_dtype=torch.bfloat16
         )
         LOGGER.info(f"Inference model loaded from {path}")
-        LOGGER.info(f"Model outline: {self.model}")
         LOGGER.info(f"Model device: {self.model.device}")
         # Fix the pad and bos tokens to avoid bug in the tokenizer
@@ -45,7 +44,7 @@ class EndpointHandler:
         )
     def check_valid_inputs(
-        self, input_a: str, input_b: str, task: int, parameters: Dict[str, Any]
     ) -> bool:
         """
         Check if the inputs are valid
@@ -104,11 +103,13 @@ class EndpointHandler:
         input_a = data.pop("input_a", None)
         input_b = data.pop("input_b", None)
         task = data.pop("task", None)
-        parameters = data.pop("parameters", None)
         # Check valid inputs
-        if not self.check_valid_inputs(input_a, input_b, task, parameters):
-            return []
         # Tokenize the input
         tokenized_input = self.tokenize_input(input_a, input_b, task)

             path, device_map="auto", torch_dtype=torch.bfloat16
         )
         LOGGER.info(f"Inference model loaded from {path}")
         LOGGER.info(f"Model device: {self.model.device}")
         # Fix the pad and bos tokens to avoid bug in the tokenizer
         )
     def check_valid_inputs(
+        self, input_a: str, input_b: str, task: int
     ) -> bool:
         """
         Check if the inputs are valid
         input_a = data.pop("input_a", None)
         input_b = data.pop("input_b", None)
         task = data.pop("task", None)
+        parameters = data.pop("parameters", {})
         # Check valid inputs
+        if not self.check_valid_inputs(input_a, input_b, task):
+            return [{"error": "Invalid inputs"}]
+        if "max_new_tokens" not in parameters:
+            parameters["max_new_tokens"] = 512
         # Tokenize the input
         tokenized_input = self.tokenize_input(input_a, input_b, task)