Spaces:

Namitg02
/

Test

Runtime error

Namitg02 commited on May 6, 2024

Commit

6bf42b4

verified ·

1 Parent(s): b640357

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -6,14 +6,12 @@ print(dataset)
 from langchain.docstore.document import Document as LangchainDocument
-RAW_KNOWLEDGE_BASE = [
-    LangchainDocument(page_content=["dataset"])
-]
 from langchain.text_splitter import RecursiveCharacterTextSplitter
 splitter = RecursiveCharacterTextSplitter(chunk_size=100, chunk_overlap=15,separators=["\n\n", "\n", " ", ""])
-docs = splitter.split_documents(RAW_KNOWLEDGE_BASE)
-#docs = splitter.split_text(str(dataset))
 from langchain_community.embeddings import HuggingFaceEmbeddings
@@ -25,7 +23,7 @@ from langchain_community.vectorstores import Chroma
 persist_directory = 'docs/chroma/'
 vectordb = Chroma.from_documents(
-    documents=[docs],
     embedding=embedding_model,
     persist_directory=persist_directory
 )

 from langchain.docstore.document import Document as LangchainDocument
+#RAW_KNOWLEDGE_BASE = [LangchainDocument(page_content=["dataset"])]
 from langchain.text_splitter import RecursiveCharacterTextSplitter
 splitter = RecursiveCharacterTextSplitter(chunk_size=100, chunk_overlap=15,separators=["\n\n", "\n", " ", ""])
+#docs = splitter.split_documents(RAW_KNOWLEDGE_BASE)
+docs = splitter.create_document(str(dataset))
 from langchain_community.embeddings import HuggingFaceEmbeddings
 persist_directory = 'docs/chroma/'
 vectordb = Chroma.from_documents(
+    documents=docs,
     embedding=embedding_model,
     persist_directory=persist_directory
 )