Spaces:

bstraehle
/

rag

Running

bstraehle commited on Oct 22, 2023

Commit

85e4f86

1 Parent(s): bfb520c

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -46,27 +46,27 @@ def invoke(openai_api_key, use_rag, prompt):
                      temperature = 0)
     if (use_rag):
         # Document loading
-        docs = []
         # Load PDF
-        loader = PyPDFLoader(PDF_URL)
-        docs.extend(loader.load())
         # Load Web
-        loader = WebBaseLoader(WEB_URL)
-        docs.extend(loader.load())
         # Load YouTube
-        loader = GenericLoader(YoutubeAudioLoader([YOUTUBE_URL_1,
-                                                   YOUTUBE_URL_2,
-                                                   YOUTUBE_URL_3], YOUTUBE_DIR),
-                               OpenAIWhisperParser())
-        docs.extend(loader.load())
         # Document splitting
-        text_splitter = RecursiveCharacterTextSplitter(chunk_overlap = 150,
-                                                       chunk_size = 1500)
-        splits = text_splitter.split_documents(docs)
         # Document storage
-        vector_db = Chroma.from_documents(documents = splits,
-                                          embedding = OpenAIEmbeddings(disallowed_special = ()),
-                                          persist_directory = CHROMA_DIR)
         # Document retrieval
         vector_db = Chroma(embedding_function = OpenAIEmbeddings(),
                            persist_directory = CHROMA_DIR)

                      temperature = 0)
     if (use_rag):
         # Document loading
+        #docs = []
         # Load PDF
+        #loader = PyPDFLoader(PDF_URL)
+        #docs.extend(loader.load())
         # Load Web
+        #loader = WebBaseLoader(WEB_URL)
+        #docs.extend(loader.load())
         # Load YouTube
+        #loader = GenericLoader(YoutubeAudioLoader([YOUTUBE_URL_1,
+        #                                           YOUTUBE_URL_2,
+        #                                           YOUTUBE_URL_3], YOUTUBE_DIR),
+        #                       OpenAIWhisperParser())
+        #docs.extend(loader.load())
         # Document splitting
+        #text_splitter = RecursiveCharacterTextSplitter(chunk_overlap = 150,
+        #                                               chunk_size = 1500)
+        #splits = text_splitter.split_documents(docs)
         # Document storage
+        #vector_db = Chroma.from_documents(documents = splits,
+        #                                  embedding = OpenAIEmbeddings(disallowed_special = ()),
+        #                                  persist_directory = CHROMA_DIR)
         # Document retrieval
         vector_db = Chroma(embedding_function = OpenAIEmbeddings(),
                            persist_directory = CHROMA_DIR)