Spaces:

rajesh1729
/

Streamlit-RAG-Chat-with-PDF

Sleeping

App Files Files Community

rajesh1729 commited on Nov 11, 2024

Commit

bca9228

verified ·

1 Parent(s): 648f1a1

Update app.py

Browse files

Files changed (1) hide show

app.py +47 -70

app.py CHANGED Viewed

@@ -4,10 +4,9 @@ from langchain.embeddings.openai import OpenAIEmbeddings
 from langchain.vectorstores import Chroma
 from langchain.text_splitter import RecursiveCharacterTextSplitter
 from langchain.chat_models import ChatOpenAI
-from langchain.chains import ConversationalRetrievalChain, ConversationChain
 from langchain.memory import ConversationBufferMemory
 from langchain.document_loaders import PyPDFLoader
-import time
 # Initialize session state variables
 if "messages" not in st.session_state:
@@ -16,16 +15,12 @@ if "chain" not in st.session_state:
     st.session_state.chain = None
 if "processed_pdfs" not in st.session_state:
     st.session_state.processed_pdfs = False
-if "waiting_for_answer" not in st.session_state:
-    st.session_state.waiting_for_answer = False
 def create_sidebar():
     with st.sidebar:
         st.title("PDF Chat")
         st.markdown("### Quick Demo of RAG")
         api_key = st.text_input("OpenAI API Key:", type="password")
         st.markdown("""
         ### Tools Used
         - OpenAI
@@ -37,48 +32,37 @@ def create_sidebar():
         2. Upload PDF
         3. Chat!
         """)
         return api_key
-def save_uploaded_file(uploaded_file, path='./uploads/'):
-    os.makedirs(path, exist_ok=True)
-    file_path = os.path.join(path, uploaded_file.name)
-    with open(file_path, "wb") as f:
-        f.write(uploaded_file.getbuffer())
-    return file_path
-def load_texts_from_papers(papers):
-    all_texts = []
-    for paper in papers:
-        try:
-            file_path = save_uploaded_file(paper)
-            loader = PyPDFLoader(file_path)
-            documents = loader.load()
-            text_splitter = RecursiveCharacterTextSplitter(
-                chunk_size=1000,
-                chunk_overlap=200,
-                length_function=len,
-                is_separator_regex=False,
-            )
-            texts = text_splitter.split_documents(documents)
-            all_texts.extend(texts)
-            os.remove(file_path)
-        except Exception as e:
-            st.error(f"Error processing {paper.name}: {str(e)}")
-    return all_texts
-def initialize_vectorstore(api_key):
-    embedding = OpenAIEmbeddings(openai_api_key=api_key)
-    vectorstore = Chroma(embedding_function=embedding, persist_directory="db")
-    return vectorstore
 def process_pdfs(papers, api_key):
     if papers and not st.session_state.processed_pdfs:
         with st.spinner("Processing PDFs..."):
-            texts = load_texts_from_papers(papers)
             if texts:
-                vectorstore = initialize_vectorstore(api_key)
                 vectorstore.add_documents(texts)
                 st.session_state.chain = ConversationalRetrievalChain.from_llm(
                     ChatOpenAI(temperature=0, model_name="gpt-3.5-turbo", openai_api_key=api_key),
                     vectorstore.as_retriever(),
@@ -92,19 +76,10 @@ def process_pdfs(papers, api_key):
             return texts
     return []
-def get_assistant_response(prompt, texts):
-    try:
-        if texts or st.session_state.processed_pdfs:
-            result = st.session_state.chain({"question": prompt})
-            return result["answer"]
-        else:
-            return "Please upload a PDF first."
-    except Exception as e:
-        return f"Error: {str(e)}"
 def main():
-    st.set_page_config(page_title="PDF Chat", layout="wide")
     api_key = create_sidebar()
     if not api_key:
@@ -116,31 +91,33 @@ def main():
     # File uploader
     papers = st.file_uploader("Upload PDFs", type=["pdf"], accept_multiple_files=True)
-    # Process PDFs
     texts = process_pdfs(papers, api_key)
-    # Chat interface
-    chat_container = st.container()
-    with chat_container:
-        # Display existing chat messages
-        for message in st.session_state.messages:
-            with st.chat_message(message["role"]):
-                st.markdown(message["content"])
-        # Get user input
-        if prompt := st.chat_input("Ask about your PDFs"):
-            # Add user message immediately
-            st.session_state.messages.append({"role": "user", "content": prompt})
-            st.chat_message("user").markdown(prompt)
-            # Get assistant response with a loading indicator
-            with st.chat_message("assistant"):
                 with st.spinner("Thinking..."):
-                    response = get_assistant_response(prompt, texts)
-                st.markdown(response)
-            # Add assistant response to messages
             st.session_state.messages.append({"role": "assistant", "content": response})
 if __name__ == "__main__":

 from langchain.vectorstores import Chroma
 from langchain.text_splitter import RecursiveCharacterTextSplitter
 from langchain.chat_models import ChatOpenAI
+from langchain.chains import ConversationalRetrievalChain
 from langchain.memory import ConversationBufferMemory
 from langchain.document_loaders import PyPDFLoader
 # Initialize session state variables
 if "messages" not in st.session_state:
     st.session_state.chain = None
 if "processed_pdfs" not in st.session_state:
     st.session_state.processed_pdfs = False
 def create_sidebar():
     with st.sidebar:
         st.title("PDF Chat")
         st.markdown("### Quick Demo of RAG")
         api_key = st.text_input("OpenAI API Key:", type="password")
         st.markdown("""
         ### Tools Used
         - OpenAI
         2. Upload PDF
         3. Chat!
         """)
         return api_key
 def process_pdfs(papers, api_key):
     if papers and not st.session_state.processed_pdfs:
         with st.spinner("Processing PDFs..."):
+            texts = []
+            for paper in papers:
+                try:
+                    file_path = os.path.join('./uploads', paper.name)
+                    os.makedirs('./uploads', exist_ok=True)
+                    with open(file_path, "wb") as f:
+                        f.write(paper.getbuffer())
+                    loader = PyPDFLoader(file_path)
+                    documents = loader.load()
+                    text_splitter = RecursiveCharacterTextSplitter(
+                        chunk_size=1000,
+                        chunk_overlap=200,
+                        length_function=len,
+                        is_separator_regex=False,
+                    )
+                    texts.extend(text_splitter.split_documents(documents))
+                    os.remove(file_path)
+                except Exception as e:
+                    st.error(f"Error processing {paper.name}: {str(e)}")
             if texts:
+                embedding = OpenAIEmbeddings(openai_api_key=api_key)
+                vectorstore = Chroma(embedding_function=embedding, persist_directory="db")
                 vectorstore.add_documents(texts)
                 st.session_state.chain = ConversationalRetrievalChain.from_llm(
                     ChatOpenAI(temperature=0, model_name="gpt-3.5-turbo", openai_api_key=api_key),
                     vectorstore.as_retriever(),
             return texts
     return []
 def main():
+    st.set_page_config(page_title="PDF Chat")
+    # Sidebar with API key input
     api_key = create_sidebar()
     if not api_key:
     # File uploader
     papers = st.file_uploader("Upload PDFs", type=["pdf"], accept_multiple_files=True)
+    # Process PDFs if needed
     texts = process_pdfs(papers, api_key)
+    # Display chat messages from history
+    for message in st.session_state.messages:
+        with st.chat_message(message["role"]):
+            st.markdown(message["content"])
+    # Accept user input
+    if prompt := st.chat_input("Ask about your PDFs"):
+        # Add user message to chat history
+        st.session_state.messages.append({"role": "user", "content": prompt})
+        # Display user message
+        with st.chat_message("user"):
+            st.markdown(prompt)
+        # Generate and display assistant response
+        with st.chat_message("assistant"):
+            if not st.session_state.processed_pdfs:
+                response = "Please upload a PDF first."
+            else:
                 with st.spinner("Thinking..."):
+                    result = st.session_state.chain({"question": prompt})
+                    response = result["answer"]
+            st.markdown(response)
             st.session_state.messages.append({"role": "assistant", "content": response})
 if __name__ == "__main__":