DEV-chat-with-pdf-openai

Sleeping

wholewhale commited on Oct 13, 2023

Commit

3e93b01

1 Parent(s): 1a0b1c4

revert

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,32 +1,30 @@
-from summarizer import Summarizer
 import gradio as gr
 from gradio import state
 import os
 import time
 import threading
 from langchain.document_loaders import OnlinePDFLoader
 from langchain.llms import OpenAI
 from langchain.vectorstores import Chroma
 from langchain.chains import ConversationalRetrievalChain
 os.environ['OPENAI_API_KEY'] = os.getenv("Your_API_Key")
-bert_model = Summarizer()
 # Declare session state for tracking last interaction time
 last_interaction_time = state.declare("last_interaction_time", 0)
 def loading_pdf():
-    return "Working the upload..."
 def pdf_changes(pdf_doc):
     loader = OnlinePDFLoader(pdf_doc.name)
     documents = loader.load()
-    # Summarize the text with BERT
-    summarized_text = bert_model(documents)
     embeddings = OpenAIEmbeddings()
-    db = Chroma.from_documents([summarized_text], embeddings)
     retriever = db.as_retriever()
     global qa
     qa = ConversationalRetrievalChain.from_llm(

 import gradio as gr
 from gradio import state
 import os
 import time
 import threading
 from langchain.document_loaders import OnlinePDFLoader
+from langchain.text_splitter import CharacterTextSplitter
 from langchain.llms import OpenAI
+from langchain.embeddings import OpenAIEmbeddings
 from langchain.vectorstores import Chroma
 from langchain.chains import ConversationalRetrievalChain
 os.environ['OPENAI_API_KEY'] = os.getenv("Your_API_Key")
 # Declare session state for tracking last interaction time
 last_interaction_time = state.declare("last_interaction_time", 0)
 def loading_pdf():
+    return "Working the upload. Also, pondering the usefulness of sporks..."
 def pdf_changes(pdf_doc):
     loader = OnlinePDFLoader(pdf_doc.name)
     documents = loader.load()
+    text_splitter = CharacterTextSplitter(chunk_size=500, chunk_overlap=50)
+    texts = text_splitter.split_documents(documents)
     embeddings = OpenAIEmbeddings()
+    db = Chroma.from_documents(texts, embeddings)
     retriever = db.as_retriever()
     global qa
     qa = ConversationalRetrievalChain.from_llm(