Spaces:

docpro
/

AWEsumCare-Demo

Running

AWEsumCare-Demo / chatbot.py

ray

initial commit

dfc6dc5 over 1 year ago

5.28 kB

	from enum import Enum
	from typing import List
	import os
	import re
	from typing import List
	from dotenv import load_dotenv
	from openai import OpenAI
	import phoenix as px
	import llama_index
	from llama_index import OpenAIEmbedding
	from llama_index.llms import ChatMessage, MessageRole, OpenAI

	load_dotenv()


	class Chatbot:
	SYSTEM_PROMPT = ""
	DENIED_ANSWER_PROMPT = ""
	CHAT_EXAMPLES = []

	def __init__(self, model_name, chunk_size, vdb_collection_name="test_store"):
	self.model_name = model_name
	self.llm = OpenAI(model=self.model_name)
	self.embed_model = OpenAIEmbedding()
	self.chunk_size = chunk_size

	self.documents = None
	self.index = None
	self.chat_engine = None
	self.service_context = None
	self.vector_store = None
	self.vdb_collection_name = vdb_collection_name

	self._setup_chatbot()

	def _setup_chatbot(self):
	self._setup_observer()
	self._setup_service_context()
	self._setup_vector_store()
	self._load_doucments()
	self._setup_index()
	self._setup_chat_engine()

	def _setup_observer(self):
	px.launch_app()
	llama_index.set_global_handler("arize_phoenix")

	def _load_doucments(self):
	pass
	print(f"Loaded {len(self.documents)} docs")

	def _setup_service_context(self):
	pass
	print("Setup service context...")

	def _setup_vector_store(self):
	pass
	print("Setup vector store...")

	def _setup_index(self):
	if self.documents is None:
	raise ValueError("No documents loaded")
	pass
	print("Built index...")

	def _setup_chat_engine(self):
	if self.index is None:
	raise ValueError("No index built")
	pass
	print("Setup chat engine...")

	def stream_chat(self, message, history):
	print(history)
	print(self.convert_to_chat_messages(history))
	response = self.chat_engine.stream_chat(
	message, chat_history=self.convert_to_chat_messages(history)
	)
	# Stream tokens as they are generated
	partial_message = ""
	for token in response.response_gen:
	partial_message += token
	yield partial_message

	urls = [source.node.metadata.get(
	"file_name") for source in response.source_nodes if source.score >= 0.78 and source.node.metadata.get("file_name")]
	if urls:
	urls = list(set(urls))
	url_section = "\n \n\n---\n\n參考: \n" + \
	"\n".join(f"- {url}" for url in urls)
	partial_message += url_section
	yield partial_message

	def convert_to_chat_messages(self, history: List[List[str]]) -> List[ChatMessage]:
	chat_messages = [ChatMessage(
	role=MessageRole.SYSTEM, content=self.SYSTEM_PROMPT)]
	for conversation in history[-3:]:
	for index, message in enumerate(conversation):
	role = MessageRole.USER if index % 2 == 0 else MessageRole.ASSISTANT
	clean_message = re.sub(
	r"\n \n\n---\n\n參考: \n.*$", "", message, flags=re.DOTALL)
	chat_messages.append(ChatMessage(
	role=role, content=clean_message.strip()))
	return chat_messages

	def predict_with_rag(self, message, history):
	return self.stream_chat(message, history)

	# barebone chatgpt methods, shared across all chatbot instance
	def _invoke_chatgpt(self, history, message, is_include_system_prompt=False):
	openai_client = OpenAI(api_key=os.getenv("OPENAI_API_KEY"))
	history_openai_format = []
	if is_include_system_prompt:
	history_openai_format.append(
	{"role": "system", "content": self.SYSTEM_PROMPT})
	for human, assistant in history:
	history_openai_format.append({"role": "user", "content": human})
	history_openai_format.append(
	{"role": "assistant", "content": assistant})
	history_openai_format.append({"role": "user", "content": message})

	import openai
	print(openai.__version__)
	stream = openai_client.chat.completions.create(
	model=self.model_name,
	messages=history_openai_format,
	temperature=1.0,
	stream=True)
	for part in stream:
	yield part.choices[0].delta.content or ""
	# partial_message = ""
	# for chunk in response:
	# if len(chunk["choices"][0]["delta"]) != 0:
	# partial_message = partial_message + \
	# chunk["choices"][0]["delta"]["content"]
	# yield partial_message

	# For 'With Prompt Wrapper' - Add system prompt, no Pinecone
	def predict_with_prompt_wrapper(self, message, history):
	yield from self._invoke_chatgpt(history, message, is_include_system_prompt=True)

	# For 'Vanilla ChatGPT' - No system prompt
	def predict_vanilla_chatgpt(self, message, history):
	yield from self._invoke_chatgpt(history, message)


	# make a enum of chatbot type and string


	class ChatbotVersion(str, Enum):
	CHATGPT_35 = "gpt-3.5-turbo-1106"
	CHATGPT_4 = "gpt-4-1106-preview"