Spaces:

Docfile
/

LegalS

Sleeping

Docfile commited on Dec 15, 2024

Commit

be48fa7

verified ·

1 Parent(s): 9a09dcf

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -64,11 +64,8 @@ def load_and_index_pdf(pdf_path):
          logging.info(f"Loading PDF document from: {pdf_path}")
          documents = SimpleDirectoryReader(input_files=[pdf_path]).load_data()
          if documents:
-            logging.info("Creating semantic splitter")
-            node_parser = create_semantic_splitter_node_parser()
-            nodes = node_parser.get_nodes_from_documents(documents)
             logging.info("Creating vector store index")
-            index = VectorStoreIndex(nodes=nodes)
             return index
          else:
             logging.warning("No documents found in the PDF")
@@ -91,10 +88,8 @@ def create_rag_pipeline(index):
     logging.info("Initializing RAG Pipeline components")
     # setup retriever
-    retriever = VectorStoreIndex(
-            index.nodes,
-            ).as_retriever(similarity_top_k=5)
      # setup query transformer
     hyde_query_transform = HyDEQueryTransform(llm=Settings.llm)

          logging.info(f"Loading PDF document from: {pdf_path}")
          documents = SimpleDirectoryReader(input_files=[pdf_path]).load_data()
          if documents:
             logging.info("Creating vector store index")
+            index = VectorStoreIndex.from_documents(documents, node_parser=create_semantic_splitter_node_parser())
             return index
          else:
             logging.warning("No documents found in the PDF")
     logging.info("Initializing RAG Pipeline components")
     # setup retriever
+    retriever = index.as_retriever(similarity_top_k=5)
      # setup query transformer
     hyde_query_transform = HyDEQueryTransform(llm=Settings.llm)