Spaces:

dobinyim
/

aie3-e2e-rag

Paused

App Files Files Community

aie3-e2e-rag / app.py

dobinyim

Update app.py

27e491c verified about 1 year ago

raw

history blame

3.05 kB

	import os
	import chainlit as cl
	from dotenv import load_dotenv
	from operator import itemgetter
	from langchain_huggingface import HuggingFaceEndpoint
	from langchain_community.document_loaders import TextLoader
	from langchain_text_splitters import RecursiveCharacterTextSplitter
	from langchain_community.vectorstores import FAISS
	from langchain_huggingface import HuggingFaceEndpointEmbeddings
	from langchain_core.prompts import PromptTemplate
	from langchain.schema.output_parser import StrOutputParser
	from langchain.schema.runnable import RunnablePassthrough
	from langchain.schema.runnable.config import RunnableConfig

	# GLOBAL SCOPE - ENTIRE APPLICATION HAS ACCESS TO VALUES SET IN THIS SCOPE #
	load_dotenv()

	HF_LLM_ENDPOINT = os.environ["HF_LLM_ENDPOINT"]
	HF_EMBED_ENDPOINT = os.environ["HF_EMBED_ENDPOINT"]
	HF_TOKEN = os.environ["HF_TOKEN"]

	vectorstore_path = "./data/vectorstore"
	index_file = os.path.join(vectorstore_path, "index.faiss")
	hf_embeddings = HuggingFaceEndpointEmbeddings(
	model=HF_EMBED_ENDPOINT,
	task="feature-extraction",
	huggingfacehub_api_token=HF_TOKEN,
	)

	vectorstore = FAISS.load_local(
	vectorstore_path,
	hf_embeddings,
	allow_dangerous_deserialization=True
	)
	hf_retriever = vectorstore.as_retriever()
	print("Loaded Vectorstore")

	RAG_PROMPT_TEMPLATE = """\
	system
	You are a helpful assistant. You answer user questions based on provided context. If you can't answer the question with the provided context, say you don't know.
	user
	User Query:
	{query}
	Context:
	{context}
	assistant
	"""

	rag_prompt = PromptTemplate.from_template(RAG_PROMPT_TEMPLATE)

	hf_llm = HuggingFaceEndpoint(
	endpoint_url=HF_LLM_ENDPOINT,
	max_new_tokens=512,
	top_k=10,
	top_p=0.95,
	temperature=0.1,
	repetition_penalty=1.0,
	huggingfacehub_api_token=HF_TOKEN,
	)

	@cl.author_rename
	def rename(original_author: str):
	rename_dict = {
	"Assistant": "Paul Graham Essay Bot"
	}
	return rename_dict.get(original_author, original_author)

	@cl.on_chat_start
	async def start_chat():
	try:
	lcel_rag_chain = (
	{"context": itemgetter("query") \| hf_retriever, "query": itemgetter("query")}
	\| rag_prompt \| hf_llm
	)
	cl.user_session.set("lcel_rag_chain", lcel_rag_chain)
	except KeyError as e:
	print(f"Session error on start: {e}")

	@cl.on_message
	async def main(message: cl.Message):
	try:
	lcel_rag_chain = cl.user_session.get("lcel_rag_chain")
	if lcel_rag_chain is None:
	await cl.Message(content="Session has expired. Please restart the chat.").send()
	return

	msg = cl.Message(content="")
	async for chunk in lcel_rag_chain.astream(
	{"query": message.content},
	config=RunnableConfig(callbacks=[cl.LangchainCallbackHandler()]),
	):
	await msg.stream_token(chunk)
	await msg.send()
	except KeyError as e:
	await cl.Message(content="An error occurred. Please restart the chat.").send()
	print(f"Session error: {e}")