hon9kon9ize
/

bart-translation-zh-yue-onnx

Inference Endpoints

Model card Files Files and versions Community

bart-translation-zh-yue-onnx / handler.py

indiejoseph's picture

Update handler.py

0b677af about 1 year ago

1.37 kB

	"""
	ModelHandler defines an example model handler for load and inference requests for MXNet CPU models
	"""
	from typing import Dict, List, Any
	from transformers import AutoTokenizer

	from optimum.onnxruntime import ORTModelForSeq2SeqLM
	from translator import Translator
	from translation_pipeline import TranslationPipeline


	class EndpointHandler:
	def __init__(self, path=""):
	self.tokenizer = AutoTokenizer.from_pretrained("hon9kon9ize/bart-translation-zh-yue-onnx")
	self.model = ORTModelForSeq2SeqLM.from_pretrained(
	"hon9kon9ize/bart-translation-zh-yue-onnx",
	provider="CPUExecutionProvider",
	encoder_file_name="encoder_model_quantized.onnx",
	decoder_file_name="decoder_model_quantized.onnx",
	decoder_file_with_past_name="decoder_with_past_model_quantized.onnx",
	)
	self.pipe = TranslationPipeline(self.model, self.tokenizer, do_sample=False, num_beams=1)
	self.translator = Translator(self.pipe, max_length=512, batch_size=1)

	def __call__(self, data: Dict[str, Any]) -> List[Dict[str, Any]]:
	inputs = data.pop("inputs", data)
	outputs = self.translator(inputs)[0]

	return outputs


	# if __name__ == "__main__":
	# my_handler = EndpointHandler(path=".")

	# output = my_handler({"inputs": "今天天氣很好"})

	# print(output)