Spaces:

tungdop2
/

T2IPromptGenerator

Sleeping

App Files Files Community

tungdop2 commited on Jul 31, 2024

Commit

affa4ce

1 Parent(s): feb3cba

fix docker

Browse files

Files changed (3) hide show

model.py +32 -21
packages.txt +0 -3
requirements.txt +5 -7

model.py CHANGED Viewed

@@ -1,6 +1,7 @@
 import os
 import torch
-from vllm import LLM, SamplingParams
 import logging
 # Configure logging
@@ -9,41 +10,51 @@ logging.basicConfig(
 )
 logger = logging.getLogger(__name__)
 class ChallengePromptGenerator:
     def __init__(
         self,
-        model_local_dir="./checkpoint-15000",
     ):
-        self.generator = LLM(
-            model_local_dir,
-        )
     def infer_prompt(
-        self,
         prompts,
         max_generation_length=77,
         beam_size=1,
         sampling_temperature=0.9,
         sampling_topk=1,
-        sampling_topp=1,
     ):
-        added_prompts = [f"{self.generator.get_tokenizer().bos_token} {prompt}" for prompt in prompts]
-        sampling_params = SamplingParams(
-            max_tokens=max_generation_length,
             temperature=sampling_temperature,
             top_k=sampling_topk,
             top_p=sampling_topp,
-            use_beam_search=(beam_size > 1),
         )
-        outputs = self.generator.generate(added_prompts, sampling_params)
-        out = []
-        for i in range(len(outputs)):
-            tmp_out = prompts[i] + outputs[i].outputs[0].text
-            # droop last unfished sentence
-            if tmp_out[-1] != ".":
-                tmp_out = ".".join(tmp_out.split(".")[:-1])
-            out.append(tmp_out)
-        return out

 import os
 import torch
+# from vllm import LLM, SamplingParams
+from transformers import AutoTokenizer, AutoModelForCausalLM
 import logging
 # Configure logging
 )
 logger = logging.getLogger(__name__)
 class ChallengePromptGenerator:
     def __init__(
         self,
+        model_local_dir="checkpoint-15000",
     ):
+        self.device = "cuda" if torch.cuda.is_available() else "cpu"
+        self.generator = AutoModelForCausalLM.from_pretrained(model_local_dir, device_map=self.device)
+        self.generator.to_bettertransformer()
+        self.tokenizer = AutoTokenizer.from_pretrained(model_local_dir)
     def infer_prompt(
+        self,
         prompts,
         max_generation_length=77,
         beam_size=1,
         sampling_temperature=0.9,
         sampling_topk=1,
+        sampling_topp=1
     ):
+        # Add bos
+        prompts = [f"{self.tokenizer.bos_token} {prompt}" for prompt in prompts]
+        # Prepare inputs
+        inputs = self.tokenizer(
+            prompts,
+            return_tensors="pt",
+            padding=True,
+            truncation=True,
+            max_length=256,
+            add_special_tokens=False
+        ).to(self.device)
+        # Generate
+        outputs = self.generator.generate(
+            **inputs,
+            max_length=max_generation_length,
+            num_beams=beam_size,
             temperature=sampling_temperature,
             top_k=sampling_topk,
             top_p=sampling_topp,
+            do_sample=True,
+            pad_token_id=self.tokenizer.pad_token_id
         )
+        # Decode
+        decoded_outputs = self.tokenizer.batch_decode(outputs, skip_special_tokens=True)
+        return decoded_outputs

packages.txt DELETED Viewed

@@ -1,3 +0,0 @@
-gcc-12
-g++-12
-libnuma-dev

requirements.txt CHANGED Viewed

@@ -1,7 +1,5 @@
-wheel
-packaging
-ninja
-numpy
-gradio
-torch -f https://download.pytorch.org/whl/cpu
-vllm

+fastapi
+uvicorn
+pydantic
+'transformers[torch]'
+optimum