njwright92
/

ComicBot_v.2-gguf

Text Generation

Model card Files Files and versions

njwright92 commited on Jul 2, 2024

Commit

1cc0294

·

verified ·

1 Parent(s): 43bdc67

Update handler.py

Files changed (1) hide show

handler.py +10 -8

handler.py CHANGED Viewed

@@ -1,6 +1,6 @@
 from ctransformers import AutoModelForCausalLM, AutoTokenizer
 from transformers import pipeline
 class EndpointHandler:
     def __init__(self, model_dir):
@@ -13,14 +13,13 @@ class EndpointHandler:
         self.model = AutoModelForCausalLM.from_pretrained(
             f"{self.model_dir}/comic_mistral-v5.2.q5_0.gguf",
             model_type="mistral",
-            lib="avx2",  # or "avx" or "basic" depending on your CPU
-            gpu_layers=0,  # Set to a number > 0 if you want to use GPU
             hf=True
         )
         self.tokenizer = AutoTokenizer.from_pretrained(self.model)
     def preprocess(self, data):
-        # You can add any preprocessing steps here if needed
         return data
     def __call__(self, data):
@@ -30,20 +29,23 @@ class EndpointHandler:
         inputs = self.preprocess(data)
         prompt = inputs["inputs"]
-        # Generate text using the model directly for streaming
         for text in self.model(prompt,
                                max_new_tokens=256,
                                temperature=0.8,
                                repetition_penalty=1.1,
                                do_sample=True,
                                stream=True):
-            yield self.postprocess({"generated_text": text})
     def postprocess(self, data):
-        # You can add any postprocessing steps here if needed
         return data
 def get_handler(model_dir):
     handler = EndpointHandler(model_dir)
     handler.load_model()

 from ctransformers import AutoModelForCausalLM, AutoTokenizer
 from transformers import pipeline
+import json
 class EndpointHandler:
     def __init__(self, model_dir):
         self.model = AutoModelForCausalLM.from_pretrained(
             f"{self.model_dir}/comic_mistral-v5.2.q5_0.gguf",
             model_type="mistral",
+            lib="avx2",
+            gpu_layers=0,
             hf=True
         )
         self.tokenizer = AutoTokenizer.from_pretrained(self.model)
     def preprocess(self, data):
         return data
     def __call__(self, data):
         inputs = self.preprocess(data)
         prompt = inputs["inputs"]
+        # Generate text using the model
+        generated_text = ""
         for text in self.model(prompt,
                                max_new_tokens=256,
                                temperature=0.8,
                                repetition_penalty=1.1,
                                do_sample=True,
                                stream=True):
+            generated_text += text
+        # Return a JSON-serializable response
+        response = {"generated_text": generated_text}
+        return json.dumps(response)
     def postprocess(self, data):
         return data
 def get_handler(model_dir):
     handler = EndpointHandler(model_dir)
     handler.load_model()