Spaces:

ubermenchh
/

chat-with-arxiv

Sleeping

ubermenchh commited on Nov 22, 2023

Commit

ee654ca

1 Parent(s): 9e0554c

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -3,7 +3,7 @@ import gradio as gr
 from langchain.document_loaders import OnlinePDFLoader
 from langchain.text_splitter import CharacterTextSplitter
 from langchain.llms import HuggingFaceHub
-from langchain.embeddings import HuggingFaceHubEmbeddings
 from langchain.vectorstores import Chroma
 from langchain.chains import RetrievalQA
@@ -18,8 +18,8 @@ def paper_changes(paper_id):
     documents = loader.load()
     text_splitter = CharacterTextSplitter(chunk_size=1024, chunk_overlap=0)
     texts = text_splitter.split_documents(documents)
-    embeddings = HuggingFaceHubEmbeddings()
-    db = Chroma.from_documents(texts, embeddings)
     retriever = db.as_retriever()
     llm = HuggingFaceHub(repo_id=repo_id, model_kwargs={'temperature': 0.5, 'max_new_tokens': 2096})
     global qa

 from langchain.document_loaders import OnlinePDFLoader
 from langchain.text_splitter import CharacterTextSplitter
 from langchain.llms import HuggingFaceHub
+from langchain.embeddings import HuggingFaceEmbeddings
 from langchain.vectorstores import Chroma
 from langchain.chains import RetrievalQA
     documents = loader.load()
     text_splitter = CharacterTextSplitter(chunk_size=1024, chunk_overlap=0)
     texts = text_splitter.split_documents(documents)
+    embeddings = HuggingFaceEmbeddings("sentence-transformers/all-mpnet-base-v2")
+    db = Chroma.from_documents(texts, embeddings, persist_directory="chroma_db")
     retriever = db.as_retriever()
     llm = HuggingFaceHub(repo_id=repo_id, model_kwargs={'temperature': 0.5, 'max_new_tokens': 2096})
     global qa