RAG-PDF-Chatbot_copied

Sleeping

sudip1987 commited on Dec 13, 2024

Commit

f0df96e

verified ·

1 Parent(s): 5de325f

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,21 +1,22 @@
-import gradio as gr
-import os
-from typing import List, Dict
-from langchain.text_splitter import (
-    RecursiveCharacterTextSplitter,
-    CharacterTextSplitter,
-    TokenTextSplitter
 )
-from langchain_community.vectorstores import FAISS, Chroma, Qdrant
-from langchain_community.document_loaders import PyPDFLoader
-from langchain.chains import ConversationalRetrievalChain
-from langchain_community.embeddings import HuggingFaceEmbeddings
-from langchain_huggingface import HuggingFaceEndpoint
-from langchain.memory import ConversationBufferMemory
-list_llm = ["meta-llama/Meta-Llama-3-8B-Instruct", "mistralai/Mistral-7B-Instruct-v0.2"]
-list_llm_simple = [os.path.basename(llm) for llm in list_llm]
-api_token = os.getenv("HF_TOKEN")
 CHUNK_SIZES = {
     "small": {"recursive": 512, "fixed": 512, "token": 256},

+import gradio as gr # used for UI dev
+import os # Built-in model to get/use the token for running huggingface source model which requires token to run
+from typing import List, Dict # Built-in model
+from langchain.text_splitter import ( # Text splitting strategies
+    RecursiveCharacterTextSplitter,#Text splitting strategies
+    CharacterTextSplitter,#Text splitting strategies
+    TokenTextSplitter#Text splitting strategies
 )
+from langchain_community.vectorstores import FAISS, Chroma, Qdrant # Vector database
+from langchain_community.document_loaders import PyPDFLoader # Convert PDF to TEXT
+from langchain.chains import ConversationalRetrievalChain # Entire retrival chain for conversation
+from langchain_community.embeddings import HuggingFaceEmbeddings # Words to no
+from langchain_huggingface import HuggingFaceEndpoint # API for generative model
+from langchain.memory import ConversationBufferMemory # Chat History
+list_llm = ["meta-llama/Meta-Llama-3-8B-Instruct", "mistralai/Mistral-7B-Instruct-v0.2"] # list of model
+list_llm_simple = [os.path.basename(llm) for llm in list_llm] # display purpose
+api_token = os.getenv("HF_TOKEN") # getting token
 CHUNK_SIZES = {
     "small": {"recursive": 512, "fixed": 512, "token": 256},