Spaces:
Sleeping
Sleeping
Update app.py
Browse files
app.py
CHANGED
@@ -7,6 +7,7 @@ from langchain.chains import RetrievalQA
|
|
7 |
from langchain.prompts import PromptTemplate
|
8 |
from pdf2image import convert_from_path
|
9 |
import os
|
|
|
10 |
|
11 |
class LayoutLMv3OCR:
|
12 |
def __init__(self):
|
@@ -41,14 +42,23 @@ def process_pdf_and_query(pdf_path, question):
|
|
41 |
return response
|
42 |
|
43 |
def chatbot_response(pdf, question):
|
|
|
44 |
pdf_path = "uploaded_pdf.pdf"
|
45 |
-
|
|
|
|
|
|
|
46 |
extracted_text = ocr_tool.extract_text(pdf_path)
|
|
|
|
|
47 |
answer = process_pdf_and_query(pdf_path, question)
|
|
|
|
|
48 |
os.remove(pdf_path)
|
|
|
49 |
return answer
|
50 |
|
51 |
-
#
|
52 |
pdf_input = gr.File(label="PDF-Datei hochladen")
|
53 |
question_input = gr.Textbox(label="Frage eingeben")
|
54 |
response_output = gr.Textbox(label="Antwort")
|
|
|
7 |
from langchain.prompts import PromptTemplate
|
8 |
from pdf2image import convert_from_path
|
9 |
import os
|
10 |
+
import shutil
|
11 |
|
12 |
class LayoutLMv3OCR:
|
13 |
def __init__(self):
|
|
|
42 |
return response
|
43 |
|
44 |
def chatbot_response(pdf, question):
|
45 |
+
# Speichern der hochgeladenen PDF-Datei auf dem Server
|
46 |
pdf_path = "uploaded_pdf.pdf"
|
47 |
+
with open(pdf_path, "wb") as f:
|
48 |
+
f.write(pdf.read()) # Speichert die hochgeladene PDF-Datei
|
49 |
+
|
50 |
+
# OCR-Textextraktion
|
51 |
extracted_text = ocr_tool.extract_text(pdf_path)
|
52 |
+
|
53 |
+
# Beantwortung der Frage basierend auf dem Dokument
|
54 |
answer = process_pdf_and_query(pdf_path, question)
|
55 |
+
|
56 |
+
# Löschen der temporären Datei nach der Verarbeitung
|
57 |
os.remove(pdf_path)
|
58 |
+
|
59 |
return answer
|
60 |
|
61 |
+
# Gradio-Interface mit der neuen API
|
62 |
pdf_input = gr.File(label="PDF-Datei hochladen")
|
63 |
question_input = gr.Textbox(label="Frage eingeben")
|
64 |
response_output = gr.Textbox(label="Antwort")
|