causewriter-chat-with-pdf-openai

Running on CPU Upgrade

wholewhale commited on Oct 16, 2023

Commit

355932a

1 Parent(s): b1c579e

increase chunk size

Files changed (1) hide show

app.py CHANGED Viewed

@@ -16,14 +16,14 @@ def loading_pdf():
 def pdf_changes(pdf_doc):
     loader = OnlinePDFLoader(pdf_doc.name)
     documents = loader.load()
-    text_splitter = CharacterTextSplitter(chunk_size=500, chunk_overlap=50)
     texts = text_splitter.split_documents(documents)
     embeddings = OpenAIEmbeddings()
     db = Chroma.from_documents(texts, embeddings)
     retriever = db.as_retriever()
     global qa
     qa = ConversationalRetrievalChain.from_llm(
-        llm=OpenAI(temperature=0.5),
         retriever=retriever,
         return_source_documents=False)
     return "Ready"
@@ -39,7 +39,7 @@ def add_text(history, text):
 def bot(history):
     response = infer(history[-1][0], history)
-    formatted_response = "**Bot:**  \n" + '  \n'.join(response.split('. '))
     history[-1][1] = ""
     for character in formatted_response:

 def pdf_changes(pdf_doc):
     loader = OnlinePDFLoader(pdf_doc.name)
     documents = loader.load()
+    text_splitter = CharacterTextSplitter(chunk_size=1000, chunk_overlap=100)
     texts = text_splitter.split_documents(documents)
     embeddings = OpenAIEmbeddings()
     db = Chroma.from_documents(texts, embeddings)
     retriever = db.as_retriever()
     global qa
     qa = ConversationalRetrievalChain.from_llm(
+        llm=OpenAI(temperature=0.2, max_tokens=8000),
         retriever=retriever,
         return_source_documents=False)
     return "Ready"
 def bot(history):
     response = infer(history[-1][0], history)
+    formatted_response = "**AI:**  \n" + '  \n'.join(response.split('. '))
     history[-1][1] = ""
     for character in formatted_response: