Spaces:

Moha782
/

gen-ai-project

Sleeping

Moha782 commited on Jun 26, 2024

Commit

38a5c45

verified ·

1 Parent(s): 3e55561

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -7,12 +7,14 @@ import numpy as np
 from huggingface_hub import InferenceClient
 from sentence_transformers import SentenceTransformer
 # Extract text from PDF
 def extract_text_from_pdf(pdf_path):
     doc = fitz.open(pdf_path)
 # Build FAISS index
 def build_faiss_index(documents):
@@ -39,9 +41,15 @@ else:
 # Hugging Face client
 client = InferenceClient("HuggingFaceH4/zephyr-7b-beta")
     return [documents[i] for i in indices[0]]
-def respond(message, history, system_message, max_tokens, temperature, top_p):
     context = "\n\n".join(relevant_docs[:3])  # Limit context to top 3 documents
     # Limit history to the last 5 exchanges to reduce payload size

 from huggingface_hub import InferenceClient
 from sentence_transformers import SentenceTransformer
 # Extract text from PDF
 def extract_text_from_pdf(pdf_path):
     doc = fitz.open(pdf_path)
+    text = ""
+    for page_num in range(doc.page_count):
+        page = doc.load_page(page_num)
+        text += page.get_text()
+    return text.split("\n\n")
 # Build FAISS index
 def build_faiss_index(documents):
 # Hugging Face client
 client = InferenceClient("HuggingFaceH4/zephyr-7b-beta")
+def retrieve_documents(query, k=5):
+    query_embedding = model.encode([query])
+    distances, indices = index.search(query_embedding, k)
     return [documents[i] for i in indices[0]]
+async def respond(message, history, system_message, max_tokens, temperature, top_p):
+    relevant_docs = retrieve_documents(message)
     context = "\n\n".join(relevant_docs[:3])  # Limit context to top 3 documents
     # Limit history to the last 5 exchanges to reduce payload size