cguynup
/

flash_gen_bert_para

Model card Files Files and versions

cguynup commited on Nov 22, 2023

Commit

ed8a7fb

·

1 Parent(s): 29013a7

Upload 2 files

Files changed (2) hide show

handler.py +26 -0
requirements.txt +63 -0

handler.py ADDED Viewed

	@@ -0,0 +1,26 @@

+from optimum.onnxruntime import ORTModelForSequenceClassification
+from transformers import AutoTokenizer
+import torch
+class EndpointHandler():
+    def __init__(self, path=""):
+        # load the optimized model
+        self.model = ORTModelForSequenceClassification.from_pretrained(path)
+        self.tokenizer = AutoTokenizer.from_pretrained(path)
+    def __call__(self, data):
+        answers = data.pop("answers")
+        paraphrases = data.pop("paraphrases")
+        inputs = self.tokenizer(answers, paraphrases, max_length=253, padding=True, truncation=True, return_tensors='pt')
+        with torch.no_grad():
+            outputs = self.model(**inputs)
+        logits = outputs.logits
+        predictions = torch.argmax(logits, dim=-1).numpy()
+        return list(predictions)

requirements.txt ADDED Viewed

	@@ -0,0 +1,63 @@

+aiohttp==3.9.0
+aiosignal==1.3.1
+attrs==23.1.0
+certifi==2023.11.17
+charset-normalizer==3.3.2
+coloredlogs==15.0.1
+datasets==2.15.0
+dill==0.3.7
+evaluate==0.4.1
+filelock==3.13.1
+flatbuffers==23.5.26
+frozenlist==1.4.0
+fsspec==2023.10.0
+huggingface-hub==0.19.4
+humanfriendly==10.0
+idna==3.4
+Jinja2==3.1.2
+MarkupSafe==2.1.3
+mpmath==1.3.0
+multidict==6.0.4
+multiprocess==0.70.15
+networkx==3.2.1
+numpy==1.26.2
+nvidia-cublas-cu12==12.1.3.1
+nvidia-cuda-cupti-cu12==12.1.105
+nvidia-cuda-nvrtc-cu12==12.1.105
+nvidia-cuda-runtime-cu12==12.1.105
+nvidia-cudnn-cu12==8.9.2.26
+nvidia-cufft-cu12==11.0.2.54
+nvidia-curand-cu12==10.3.2.106
+nvidia-cusolver-cu12==11.4.5.107
+nvidia-cusparse-cu12==12.1.0.106
+nvidia-nccl-cu12==2.18.1
+nvidia-nvjitlink-cu12==12.3.101
+nvidia-nvtx-cu12==12.1.105
+onnx==1.15.0
+onnxruntime==1.16.3
+optimum==1.14.1
+packaging==23.2
+pandas==2.1.3
+protobuf==4.25.1
+pyarrow==14.0.1
+pyarrow-hotfix==0.6
+python-dateutil==2.8.2
+pytz==2023.3.post1
+PyYAML==6.0.1
+regex==2023.10.3
+requests==2.31.0
+responses==0.18.0
+safetensors==0.4.0
+sentencepiece==0.1.99
+six==1.16.0
+sympy==1.12
+tokenizers==0.15.0
+torch==2.1.1
+tqdm==4.66.1
+transformers==4.35.2
+triton==2.1.0
+typing_extensions==4.8.0
+tzdata==2023.3
+urllib3==2.1.0
+xxhash==3.4.1
+yarl==1.9.3