la04 commited on
Commit
24d5864
·
verified ·
1 Parent(s): 63f2e2a

Update app.py

Browse files
Files changed (1) hide show
  1. app.py +12 -2
app.py CHANGED
@@ -7,6 +7,7 @@ from langchain.chains import RetrievalQA
7
  from langchain.prompts import PromptTemplate
8
  from pdf2image import convert_from_path
9
  import os
 
10
 
11
  class LayoutLMv3OCR:
12
  def __init__(self):
@@ -41,14 +42,23 @@ def process_pdf_and_query(pdf_path, question):
41
  return response
42
 
43
  def chatbot_response(pdf, question):
 
44
  pdf_path = "uploaded_pdf.pdf"
45
- pdf.save(pdf_path)
 
 
 
46
  extracted_text = ocr_tool.extract_text(pdf_path)
 
 
47
  answer = process_pdf_and_query(pdf_path, question)
 
 
48
  os.remove(pdf_path)
 
49
  return answer
50
 
51
- # Ändere 'inputs' und 'outputs' zur neuen Gradio API
52
  pdf_input = gr.File(label="PDF-Datei hochladen")
53
  question_input = gr.Textbox(label="Frage eingeben")
54
  response_output = gr.Textbox(label="Antwort")
 
7
  from langchain.prompts import PromptTemplate
8
  from pdf2image import convert_from_path
9
  import os
10
+ import shutil
11
 
12
  class LayoutLMv3OCR:
13
  def __init__(self):
 
42
  return response
43
 
44
  def chatbot_response(pdf, question):
45
+ # Speichern der hochgeladenen PDF-Datei auf dem Server
46
  pdf_path = "uploaded_pdf.pdf"
47
+ with open(pdf_path, "wb") as f:
48
+ f.write(pdf.read()) # Speichert die hochgeladene PDF-Datei
49
+
50
+ # OCR-Textextraktion
51
  extracted_text = ocr_tool.extract_text(pdf_path)
52
+
53
+ # Beantwortung der Frage basierend auf dem Dokument
54
  answer = process_pdf_and_query(pdf_path, question)
55
+
56
+ # Löschen der temporären Datei nach der Verarbeitung
57
  os.remove(pdf_path)
58
+
59
  return answer
60
 
61
+ # Gradio-Interface mit der neuen API
62
  pdf_input = gr.File(label="PDF-Datei hochladen")
63
  question_input = gr.Textbox(label="Frage eingeben")
64
  response_output = gr.Textbox(label="Antwort")