Spaces:

aipoc
/

Broadridge_DOC_QA

Sleeping

robertselvam commited on Dec 14, 2024

Commit

25d627b

verified ·

1 Parent(s): bfe7468

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -6,6 +6,8 @@ from langchain.memory import ConversationBufferMemory
 from langchain.chains import ConversationChain
 from langchain.chains import ConversationalRetrievalChain
 from langchain.document_loaders import UnstructuredFileLoader
 from typing import List, Dict, Tuple
 import gradio as gr
 import validators
@@ -45,9 +47,10 @@ class ChatDocumentQA:
             List[str]: Extracted text from the PDFs.
         """
         docs = []
-        loaders = [UnstructuredFileLoader(file_obj, strategy="fast") for file_obj in file_paths]
         for loader in loaders:
             docs.extend(loader.load())
         return docs
     def _get_content_from_url(self, urls: str) -> List[str]:

 from langchain.chains import ConversationChain
 from langchain.chains import ConversationalRetrievalChain
 from langchain.document_loaders import UnstructuredFileLoader
+from langchain_community.document_loaders import PyPDFLoader
 from typing import List, Dict, Tuple
 import gradio as gr
 import validators
             List[str]: Extracted text from the PDFs.
         """
         docs = []
+        loaders = [PyPDFLoader(file_obj) for file_obj in file_paths]
         for loader in loaders:
             docs.extend(loader.load())
+        print("docs", docs)
         return docs
     def _get_content_from_url(self, urls: str) -> List[str]: