Spaces:

geetu040
/

test-public

Sleeping

App Files Files Community

geetu040 commited on Mar 14

Commit

ced6b34

1 Parent(s): eea7eec

upload files

Browse files

Files changed (4) hide show

Dockerfile +16 -0
app.py +65 -0
orator.py +146 -0
requirements.txt +7 -0

Dockerfile ADDED Viewed

	@@ -0,0 +1,16 @@

+# Read the doc: https://huggingface.co/docs/hub/spaces-sdks-docker
+# you will also find guides on how best to write your Dockerfile
+FROM python:3.9
+RUN useradd -m -u 1000 user
+USER user
+ENV PATH="/home/user/.local/bin:$PATH"
+WORKDIR /app
+COPY --chown=user ./requirements.txt requirements.txt
+RUN pip install --no-cache-dir --upgrade -r requirements.txt
+COPY --chown=user . /app
+CMD ["uvicorn", "app:app", "--host", "0.0.0.0", "--port", "7860"]

app.py ADDED Viewed

	@@ -0,0 +1,65 @@

+from fastapi import FastAPI, HTTPException
+from pydantic import BaseModel
+from orator import Session, SQLDatabase, DocumentDatabase
+from langchain.chat_models import init_chat_model
+from fastapi.responses import StreamingResponse
+from fastapi.middleware.cors import CORSMiddleware
+import asyncio
+# Initialize FastAPI app
+app = FastAPI(title="Orator Chat API")
+app.add_middleware(
+	CORSMiddleware,
+	allow_origins=["*"],  # Use a specific origin in production
+	allow_credentials=True,
+	allow_methods=["*"],  # Allow all methods (GET, POST, etc.)
+	allow_headers=["*"],  # Allow all headers
+)
+# Initialize LLM and databases
+llm = init_chat_model("o3-mini", model_provider="openai")
+chinook_db = SQLDatabase.from_uri("sqlite:////home/geetu/work/orator/data/chinook/Chinook.db")
+pricegram_db = DocumentDatabase("/home/geetu/work/orator/data/pricegram/data.json", top_k=10)
+# Initialize session
+session = Session(llm=llm, datasources=[chinook_db, pricegram_db])
+# Pydantic model for request
+class QueryRequest(BaseModel):
+	query: str
+	source: int
+@app.post("/query/")
+async def get_response(request: QueryRequest):
+	"""Process a query and return the response."""
+	try:
+		print("Got Request:", request)
+		response, logs = session.invoke(request.query, datasource=request.source)
+		response = {"response": response}
+		print("Sending Respose:", response)
+		return response
+	except Exception as e:
+		raise HTTPException(status_code=500, detail=str(e))
+@app.post("/query/stream/")
+async def stream_response(request: QueryRequest):
+	"""Stream responses for a given query."""
+	async def event_generator():
+		try:
+			events = session.stream(request.query)
+			for event in events:
+				for person, quote in event.items():
+					yield f"{person}: {quote['messages'][-1].text}\n"
+					await asyncio.sleep(0.1)  # Simulate streaming delay
+		except Exception as e:
+			yield f"Error: {str(e)}"
+	return StreamingResponse(event_generator(), media_type="text/plain")
+@app.get("/")
+async def root():
+	return {"message": "Welcome to the Orator Chat API"}

orator.py ADDED Viewed

	@@ -0,0 +1,146 @@

+import json
+from abc import abstractmethod, ABC
+from langchain_community.utilities.sql_database import SQLDatabase as LangchainSQLDatabase
+from langchain_community.agent_toolkits.sql.toolkit import SQLDatabaseToolkit
+from langchain_community.utilities.sql_database import SQLDatabase as LangchainSQLDatabase
+from langchain_community.agent_toolkits.sql.toolkit import SQLDatabaseToolkit
+from langchain_core.vectorstores import InMemoryVectorStore
+from langchain_core.messages import SystemMessage, HumanMessage
+from langchain_core.language_models.chat_models import BaseChatModel
+from langchain_huggingface import HuggingFaceEmbeddings
+from langchain import hub
+from langchain.agents import create_react_agent
+from langchain.schema import SystemMessage
+from langchain.schema import SystemMessage, HumanMessage
+from langchain.schema.runnable import RunnableLambda, RunnablePassthrough
+from langgraph.prebuilt import create_react_agent
+class Database(ABC):
+	@abstractmethod
+	def create_agent(self, llm):
+		raise NotImplementedError
+class Session:
+	def __init__(self, llm: BaseChatModel, datasources=None):
+		self.llm = llm
+		self.datasources = datasources
+		self._datasources = []
+		self._dataagents = []
+		if self.datasources is not None:
+			for datasource in self.datasources:
+				self.add_datasource(datasource)
+	def add_datasource(self, database: Database):
+		agent = database.create_agent(self.llm)
+		self._datasources.append(database)
+		self._dataagents.append(agent)
+	def get_relevant_source(self, message, datasource):
+		if datasource is not None:
+			return self._datasources[datasource], self._dataagents[datasource]
+		return self._datasources[0], self._dataagents[0]
+	def invoke(self, message, datasource=None):
+		db, agent = self.get_relevant_source(message, datasource)
+		processed_message = db.process_message(message)
+		response = agent.invoke(processed_message)
+		processed_response = db.postprocess(response)
+		return processed_response, response
+	def stream(self, message, stream_mode=None):
+		db, agent = self.get_relevant_source(message)
+		return agent.stream(
+			{"messages": [("user", message)]},
+			stream_mode=stream_mode,
+		)
+class SQLDatabase(Database):
+	def __init__(self, db):
+		self.db = db
+	def create_agent(self, llm):
+		toolkit = SQLDatabaseToolkit(db=self.db, llm=llm)
+		prompt_template = hub.pull("langchain-ai/sql-agent-system-prompt")
+		system_message = prompt_template.format(dialect="SQLite", top_k=5)
+		agent = create_react_agent(llm, toolkit.get_tools(), prompt=system_message)
+		return agent
+	def process_message(self, message):
+		return {"messages": [("user", message)]}
+	def postprocess(self, response):
+		return response['messages'][-1].content
+	@classmethod
+	def from_uri(cls, database_uri, engine_args=None, **kwargs):
+		db = LangchainSQLDatabase.from_uri(database_uri, engine_args, **kwargs)
+		return cls(db)
+class DocumentDatabase(Database):
+	def __init__(
+			self,
+			path: str,
+			model_name: str = "sentence-transformers/all-mpnet-base-v2",
+			top_k: int = 3,
+			model_kwargs = None,
+			encode_kwargs = None,
+		):
+		self.path = path
+		self.model_name = model_name
+		self.top_k = top_k
+		self.model_kwargs = {"device": "cpu"} if model_kwargs is None else model_kwargs
+		self.encode_kwargs = {"batch_size": 8} if encode_kwargs is None else encode_kwargs
+		embeddings = HuggingFaceEmbeddings(
+			model_name=self.model_name,
+			model_kwargs=self.model_kwargs,
+			encode_kwargs=self.encode_kwargs,
+			show_progress=False,
+		)
+		self.vector_store = InMemoryVectorStore(embeddings)
+		with open(path, 'rb') as f:
+			self.vector_store.store = json.load(f)
+	def create_agent(self, llm):
+		# Step 1: Retrieve relevant documents from the vector store
+		retrieve_docs = RunnableLambda(lambda message: (message, self.vector_store.similarity_search(message, k=self.top_k)))
+		# Step 2: Format the retrieved docs into a prompt
+		def format_prompt(inputs):
+			message, docs = inputs
+			prompt = [
+				SystemMessage(
+					"You are an assistant for question-answering tasks. "
+					"Use the following pieces of retrieved context to answer "
+					"the question. If you don't know the answer, say that you "
+					"don't know. Use three sentences maximum and keep the "
+					"answer concise."
+					"\n\n"
+					f"{'\n\n'.join(doc.page_content for doc in docs)}"
+				),
+				HumanMessage(message)
+			]
+			return prompt
+		format_prompt_node = RunnableLambda(format_prompt)
+		# Step 3: Invoke LLM with the formatted prompt
+		invoke_llm = llm
+		# Step 4: Chain everything together
+		agent_pipeline = RunnablePassthrough() | retrieve_docs | format_prompt_node | invoke_llm
+		return agent_pipeline
+	def process_message(self, message):
+		return message
+	def postprocess(self, response):
+		return response.content

requirements.txt ADDED Viewed

	@@ -0,0 +1,7 @@

+fastapi
+uvicorn[standard]
+langchain
+langgraph
+langchain-core
+langchain-community
+langchain-huggingface