Spaces:

bupa1018
/

KadiAPY_Coding_Assistant

Sleeping

bupa1018 commited on Mar 8

Commit

6288d92

1 Parent(s): dc76e41

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -17,6 +17,7 @@ from dotenv import load_dotenv
 from langchain.docstore.document import Document
 from langchain.schema import Document
 from chunk_python_code import chunk_python_code_with_metadata
 # Load environment variables from .env file
 load_dotenv()
@@ -241,16 +242,13 @@ def split_into_chunks(texts, references, chunk_size, chunk_overlap):
     return chunks
 # Setup Vectorstore
-def setup_vectorstore(chunks, model_name, persist_directory):
     print("Start setup_vectorstore_function")
     embedding_model = HuggingFaceEmbeddings(model_name=model_name)
-    vectorstore = Chroma.from_documents(chunks, embedding=embedding_model, persist_directory=persist_directory)
     return vectorstore
 # Setup LLM
 def setup_llm(model_name, temperature, api_key):
     llm = ChatGroq(model=model_name, temperature=temperature, api_key=api_key)
@@ -365,8 +363,8 @@ def initialize():
     print(f"Total number of code_chunks: {len(kadiAPY_code_chunks)}")
     print(f"Total number of doc_chunks: {len(kadiAPY_doc_chunks)}")
-    docstore = setup_vectorstore(kadiAPY_code_chunks, EMBEDDING_MODEL_NAME, PERSIST_DOC_DIRECTORY)
-    codestore = setup_vectorstore(kadiAPY_doc_chunks, EMBEDDING_MODEL_NAME, PERSIST_CODE_DIRECTORY)
     llm = setup_llm(LLM_MODEL_NAME, LLM_TEMPERATURE, GROQ_API_KEY)

 from langchain.docstore.document import Document
 from langchain.schema import Document
 from chunk_python_code import chunk_python_code_with_metadata
+from vectorstore.py import get_chroma_vectorstore
 # Load environment variables from .env file
 load_dotenv()
     return chunks
 # Setup Vectorstore
+def embed_documents_into_vectorstore(chunks, model_name, persist_directory):
     print("Start setup_vectorstore_function")
     embedding_model = HuggingFaceEmbeddings(model_name=model_name)
+    vectorstore = get_chroma_vectorstore(embedding_model)
+    vectorstore.add_documents(chunks)
     return vectorstore
 # Setup LLM
 def setup_llm(model_name, temperature, api_key):
     llm = ChatGroq(model=model_name, temperature=temperature, api_key=api_key)
     print(f"Total number of code_chunks: {len(kadiAPY_code_chunks)}")
     print(f"Total number of doc_chunks: {len(kadiAPY_doc_chunks)}")
+    docstore = embed_documents_into_vectorstore(kadiAPY_code_chunks, EMBEDDING_MODEL_NAME, PERSIST_DOC_DIRECTORY)
+    codestore = embed_documents_into_vectorstore(kadiAPY_doc_chunks, EMBEDDING_MODEL_NAME, PERSIST_CODE_DIRECTORY)
     llm = setup_llm(LLM_MODEL_NAME, LLM_TEMPERATURE, GROQ_API_KEY)