Spaces:

vincentmin
/

ArxivNewsLetter

Sleeping

vincentmin commited on Jun 24, 2023

Commit

ee043ca

1 Parent(s): b12ca56

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,7 +1,7 @@
 from datetime import date, timedelta
 from langchain.document_loaders import ArxivLoader
 from langchain.text_splitter import RecursiveCharacterTextSplitter
-from langchain.vectorstores import FAISS
 from langchain.embeddings import HuggingFaceEmbeddings
 def get_data(user_query: str, load_max_docs: int = 5, chunk_size: int=1000):
@@ -13,7 +13,7 @@ def get_data(user_query: str, load_max_docs: int = 5, chunk_size: int=1000):
     text_splitter = RecursiveCharacterTextSplitter(chunk_size=chunk_size)
     texts = text_splitter.split_documents(documents)
     embeddings = HuggingFaceEmbeddings()
-    db = FAISS.from_documents(texts, embeddings)
     retriever = db.as_retriever()
     docs = retriever.get_relevant_documents(user_query)
     print(docs[0].metadata)

 from datetime import date, timedelta
 from langchain.document_loaders import ArxivLoader
 from langchain.text_splitter import RecursiveCharacterTextSplitter
+from langchain.vectorstores import Chroma
 from langchain.embeddings import HuggingFaceEmbeddings
 def get_data(user_query: str, load_max_docs: int = 5, chunk_size: int=1000):
     text_splitter = RecursiveCharacterTextSplitter(chunk_size=chunk_size)
     texts = text_splitter.split_documents(documents)
     embeddings = HuggingFaceEmbeddings()
+    db = Chroma.from_documents(texts, embeddings)
     retriever = db.as_retriever()
     docs = retriever.get_relevant_documents(user_query)
     print(docs[0].metadata)