RAG-Vereine

Sleeping

pratikshahp commited on Jul 10, 2024

Commit

072fb13

verified ·

1 Parent(s): d189514

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -2,7 +2,7 @@ import gradio as gr
 import fitz  # PyMuPDF
 import torch
 from transformers import AutoTokenizer, AutoModelForCausalLM
-from langchain.vectorstores import Chroma
 from langchain_community.embeddings import HuggingFaceEmbeddings
 from langchain_text_splitters import RecursiveCharacterTextSplitter
 import os
@@ -33,9 +33,9 @@ def get_llm_response(input_prompt, content, prompt):
 # Function to extract text from PDF file
-def extract_text_from_pdf(file):
     try:
-        doc = fitz.open(stream=file.read(), filetype="pdf")
         text = ""
         for page in doc:
             text += page.get_text()
@@ -47,7 +47,7 @@ def extract_text_from_pdf(file):
 def process_pdf(uploaded_file, prompt):
     if uploaded_file is not None:
         # Extract text from uploaded PDF file
-        pdf_text = extract_text_from_pdf(uploaded_file)
         if pdf_text:
             try:
                 # Create embeddings
@@ -92,8 +92,8 @@ def process_pdf(uploaded_file, prompt):
 def main():
     gr.Interface(
         fn=process_pdf,
-        inputs=[gr.components.File(type="file", label="Upload PDF File"),
-                gr.components.Textbox(lines=2, placeholder="Ask a Question")],
         outputs="text",
         title="PDF Chatbot",
         description="Upload a PDF file and ask questions about its content."

 import fitz  # PyMuPDF
 import torch
 from transformers import AutoTokenizer, AutoModelForCausalLM
+from langchain_community.vectorstores import Chroma
 from langchain_community.embeddings import HuggingFaceEmbeddings
 from langchain_text_splitters import RecursiveCharacterTextSplitter
 import os
 # Function to extract text from PDF file
+def extract_text_from_pdf(file_path):
     try:
+        doc = fitz.open(file_path)
         text = ""
         for page in doc:
             text += page.get_text()
 def process_pdf(uploaded_file, prompt):
     if uploaded_file is not None:
         # Extract text from uploaded PDF file
+        pdf_text = extract_text_from_pdf(uploaded_file.name)
         if pdf_text:
             try:
                 # Create embeddings
 def main():
     gr.Interface(
         fn=process_pdf,
+        inputs=[gr.File(type="filepath", label="Upload PDF File"),
+                gr.Textbox(lines=2, placeholder="Ask a Question")],
         outputs="text",
         title="PDF Chatbot",
         description="Upload a PDF file and ask questions about its content."