Spaces:

lpetrl
/

demo-llm

Sleeping

demo-llm / main.py

Petro

273463a over 1 year ago

745 Bytes

	from ctransformers import AutoModelForCausalLM
	from fastapi import FastAPI
	from pydantic import BaseModel
	import requests
	#
	# llm = AutoModelForCausalLM.from_pretrained("zephyr-7b-beta.Q4_K_S.gguf",
	# model_type='mistral',
	# max_new_tokens = 1096,
	# threads = 3,
	# )

	#Pydantic object
	class validation(BaseModel):
	prompt: str
	#Fast API

	app = FastAPI()

	@app.post("/llm_on_cpu")
	async def stream(item: validation):
	system_prompt = 'Below is an instruction that describes a task. Write a response that appropriately completes the request.'
	E_INST = "</s>"
	user, assistant = "<\|user\|>", "<\|assistant\|>"
	prompt = f"{system_prompt}{E_INST}\n{user}\n{item.prompt}{E_INST}\n{assistant}\n"
	# return llm(prompt)
	return prompt