Spaces:

la04
/

RAG_test_1

Sleeping

la04 commited on Jan 9

Commit

24d5864

verified ·

1 Parent(s): 63f2e2a

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -7,6 +7,7 @@ from langchain.chains import RetrievalQA
 from langchain.prompts import PromptTemplate
 from pdf2image import convert_from_path
 import os
 class LayoutLMv3OCR:
     def __init__(self):
@@ -41,14 +42,23 @@ def process_pdf_and_query(pdf_path, question):
     return response
 def chatbot_response(pdf, question):
     pdf_path = "uploaded_pdf.pdf"
-    pdf.save(pdf_path)
     extracted_text = ocr_tool.extract_text(pdf_path)
     answer = process_pdf_and_query(pdf_path, question)
     os.remove(pdf_path)
     return answer
-# Ändere 'inputs' und 'outputs' zur neuen Gradio API
 pdf_input = gr.File(label="PDF-Datei hochladen")
 question_input = gr.Textbox(label="Frage eingeben")
 response_output = gr.Textbox(label="Antwort")

 from langchain.prompts import PromptTemplate
 from pdf2image import convert_from_path
 import os
+import shutil
 class LayoutLMv3OCR:
     def __init__(self):
     return response
 def chatbot_response(pdf, question):
+    # Speichern der hochgeladenen PDF-Datei auf dem Server
     pdf_path = "uploaded_pdf.pdf"
+    with open(pdf_path, "wb") as f:
+        f.write(pdf.read())  # Speichert die hochgeladene PDF-Datei
+    # OCR-Textextraktion
     extracted_text = ocr_tool.extract_text(pdf_path)
+    # Beantwortung der Frage basierend auf dem Dokument
     answer = process_pdf_and_query(pdf_path, question)
+    # Löschen der temporären Datei nach der Verarbeitung
     os.remove(pdf_path)
     return answer
+# Gradio-Interface mit der neuen API
 pdf_input = gr.File(label="PDF-Datei hochladen")
 question_input = gr.Textbox(label="Frage eingeben")
 response_output = gr.Textbox(label="Antwort")