Spaces:

DeepSoft-Technologies
/

DeepChat-PDF

Sleeping

App Files Files Community

DeepSoft-Tech commited on Feb 4, 2024

Commit

ee01867

verified ·

1 Parent(s): 2723949

Upload 4 files

Browse files

Files changed (4) hide show

README.md +5 -5
app.py +78 -0
gitattributes +35 -0
requirements.txt +6 -0

README.md CHANGED Viewed

@@ -1,10 +1,10 @@
 ---
-title: DeepChat PDF
-emoji: ⚡
-colorFrom: red
-colorTo: indigo
 sdk: streamlit
-sdk_version: 1.31.0
 app_file: app.py
 pinned: false
 ---

 ---
+title: ChatPdf
+emoji: 📊
+colorFrom: blue
+colorTo: red
 sdk: streamlit
+sdk_version: 1.29.0
 app_file: app.py
 pinned: false
 ---

app.py ADDED Viewed

	@@ -0,0 +1,78 @@

+import streamlit as st
+import os
+from PyPDF2 import PdfReader
+from langchain.text_splitter import CharacterTextSplitter
+from langchain.embeddings.openai import OpenAIEmbeddings
+from langchain.vectorstores import FAISS
+from langchain.chains.question_answering import load_qa_chain
+from langchain.callbacks import get_openai_callback
+from langchain import HuggingFaceHub, LLMChain
+from langchain.embeddings import HuggingFaceHubEmbeddings,HuggingFaceInferenceAPIEmbeddings
+token = os.environ['HF_TOKEN']
+repo_id = "sentence-transformers/all-mpnet-base-v2"
+hf = HuggingFaceHubEmbeddings(
+    repo_id=repo_id,
+    task="feature-extraction",
+    huggingfacehub_api_token= token,
+)
+from langchain.embeddings import HuggingFaceInferenceAPIEmbeddings
+embeddings = HuggingFaceInferenceAPIEmbeddings(
+    api_key=token, model_name="sentence-transformers/all-MiniLM-l6-v2"
+)
+def main():
+    st.set_page_config(page_title="Ask your PDF")
+    st.header("Ask your PDF 💬")
+    # upload file
+    pdf = st.file_uploader("Upload your PDF", type="pdf")
+    # extract the text
+    if pdf is not None:
+      pdf_reader = PdfReader(pdf)
+      text = ""
+      for page in pdf_reader.pages:
+        text += page.extract_text()
+      # split into chunks
+      text_splitter = CharacterTextSplitter(
+        separator="\n",
+        chunk_size=1000,
+        chunk_overlap=200,
+        length_function=len
+      )
+      chunks = text_splitter.split_text(text)
+      # create embeddings
+      # embeddings = OpenAIEmbeddings()
+      # embeddings = query(chunks)
+      # embeddings = HuggingFaceEmbeddings(model_name="sentence-transformers/all-mpnet-base-v2")
+      knowledge_base = FAISS.from_texts(chunks, embeddings)
+      # show user input
+      user_question = st.text_input("Ask a question about your PDF:")
+      if user_question:
+        docs = knowledge_base.similarity_search(user_question)
+        # llm = OpenAI()
+        hub_llm = HuggingFaceHub(
+        repo_id='HuggingFaceH4/zephyr-7b-beta',
+    model_kwargs={'temperature':0.01,"max_length": 2048,},
+    huggingfacehub_api_token=token)
+        llm = hub_llm
+        chain = load_qa_chain(llm, chain_type="stuff")
+        with get_openai_callback() as cb:
+          response = chain.run(input_documents=docs, question=user_question)
+          print(cb)
+        st.write(response)
+if __name__ == '__main__':
+    main()

gitattributes ADDED Viewed

	@@ -0,0 +1,35 @@

+*.7z filter=lfs diff=lfs merge=lfs -text
+*.arrow filter=lfs diff=lfs merge=lfs -text
+*.bin filter=lfs diff=lfs merge=lfs -text
+*.bz2 filter=lfs diff=lfs merge=lfs -text
+*.ckpt filter=lfs diff=lfs merge=lfs -text
+*.ftz filter=lfs diff=lfs merge=lfs -text
+*.gz filter=lfs diff=lfs merge=lfs -text
+*.h5 filter=lfs diff=lfs merge=lfs -text
+*.joblib filter=lfs diff=lfs merge=lfs -text
+*.lfs.* filter=lfs diff=lfs merge=lfs -text
+*.mlmodel filter=lfs diff=lfs merge=lfs -text
+*.model filter=lfs diff=lfs merge=lfs -text
+*.msgpack filter=lfs diff=lfs merge=lfs -text
+*.npy filter=lfs diff=lfs merge=lfs -text
+*.npz filter=lfs diff=lfs merge=lfs -text
+*.onnx filter=lfs diff=lfs merge=lfs -text
+*.ot filter=lfs diff=lfs merge=lfs -text
+*.parquet filter=lfs diff=lfs merge=lfs -text
+*.pb filter=lfs diff=lfs merge=lfs -text
+*.pickle filter=lfs diff=lfs merge=lfs -text
+*.pkl filter=lfs diff=lfs merge=lfs -text
+*.pt filter=lfs diff=lfs merge=lfs -text
+*.pth filter=lfs diff=lfs merge=lfs -text
+*.rar filter=lfs diff=lfs merge=lfs -text
+*.safetensors filter=lfs diff=lfs merge=lfs -text
+saved_model/**/* filter=lfs diff=lfs merge=lfs -text
+*.tar.* filter=lfs diff=lfs merge=lfs -text
+*.tar filter=lfs diff=lfs merge=lfs -text
+*.tflite filter=lfs diff=lfs merge=lfs -text
+*.tgz filter=lfs diff=lfs merge=lfs -text
+*.wasm filter=lfs diff=lfs merge=lfs -text
+*.xz filter=lfs diff=lfs merge=lfs -text
+*.zip filter=lfs diff=lfs merge=lfs -text
+*.zst filter=lfs diff=lfs merge=lfs -text
+*tfevents* filter=lfs diff=lfs merge=lfs -text

requirements.txt ADDED Viewed

	@@ -0,0 +1,6 @@

+pydantic
+langchain
+PyPDF2
+faiss-cpu
+altair<5
+huggingface_hub