Spaces:

antoniorached
/

chatbot

Sleeping

App Files Files Community

antoniorached commited on Sep 1, 2024

Commit

3c11d84

verified ·

1 Parent(s): 3f5dec9

Update app.py

Browse files

Files changed (1) hide show

app.py +38 -30

app.py CHANGED Viewed

@@ -1,4 +1,5 @@
 import os
 from langchain_openai import ChatOpenAI
 from langchain_community.embeddings import HuggingFaceEmbeddings
 from langchain.text_splitter import RecursiveCharacterTextSplitter
@@ -26,32 +27,32 @@ Helpful answer:
 prompt = PromptTemplate(template=template, input_variables=["context", "question"])
-# Load and process the PDF
-loader = PyPDFLoader(pdf_file.name)
-pdf_data = loader.load()
-# Split the text into chunks
-text_splitter = RecursiveCharacterTextSplitter(chunk_size=1000, chunk_overlap=200)
-docs = text_splitter.split_documents(pdf_data)
-# Create a Chroma vector store
-embeddings = HuggingFaceEmbeddings(model_name="embaas/sentence-transformers-multilingual-e5-base")
-db = Chroma.from_documents(docs, embeddings)
-# Initialize message history for conversation
-message_history = ChatMessageHistory()
-# Memory for conversational context
-memory = ConversationBufferMemory(
-       memory_key="chat_history",
-       output_key="answer",
-       chat_memory=message_history,
-       return_messages=True,
-   )
-# Create a chain that uses the Chroma vector store
-chain = ConversationalRetrievalChain.from_llm(
         llm=llm,
         chain_type="stuff",
         retriever=db.as_retriever(),
@@ -59,8 +60,15 @@ chain = ConversationalRetrievalChain.from_llm(
         return_source_documents=False,
         combine_docs_chain_kwargs={'prompt': prompt}
     )
-# Process the question
-res = chain({"question": question})
-answer = res["answer"]

 import os
+import gradio as gr
 from langchain_openai import ChatOpenAI
 from langchain_community.embeddings import HuggingFaceEmbeddings
 from langchain.text_splitter import RecursiveCharacterTextSplitter
 prompt = PromptTemplate(template=template, input_variables=["context", "question"])
+def process_pdf_and_answer(pdf_file, question):
+    # Load and process the PDF
+    loader = PyPDFLoader(pdf_file.name)
+    pdf_data = loader.load()
+    # Split the text into chunks
+    text_splitter = RecursiveCharacterTextSplitter(chunk_size=1000, chunk_overlap=200)
+    docs = text_splitter.split_documents(pdf_data)
+    # Create a Chroma vector store
+    embeddings = HuggingFaceEmbeddings(model_name="embaas/sentence-transformers-multilingual-e5-base")
+    db = Chroma.from_documents(docs, embeddings)
+    # Initialize message history for conversation
+    message_history = ChatMessageHistory()
+    # Memory for conversational context
+    memory = ConversationBufferMemory(
+           memory_key="chat_history",
+           output_key="answer",
+           chat_memory=message_history,
+           return_messages=True,
+    )
+    # Create a chain that uses the Chroma vector store
+    chain = ConversationalRetrievalChain.from_llm(
         llm=llm,
         chain_type="stuff",
         retriever=db.as_retriever(),
         return_source_documents=False,
         combine_docs_chain_kwargs={'prompt': prompt}
     )
+    # Process the question
+    res = chain({"question": question})
+    answer = res["answer"]
+gr.Interface(
+    fn=process_pdf_and_answer,
+    inputs=[gr.File(file_count="single", type="filepath"), gr.Textbox(lines=2, placeholder="Ask a question...")],
+    outputs="text",
+    title="PDF Q&A",
+    description="Upload a pdf and ask questions about it"
+).launch()