Spaces:

la04
/

RAG_test_1

Sleeping

la04 commited on Jan 9

Commit

a40161a

verified ·

1 Parent(s): 24d5864

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -7,7 +7,7 @@ from langchain.chains import RetrievalQA
 from langchain.prompts import PromptTemplate
 from pdf2image import convert_from_path
 import os
-import shutil
 class LayoutLMv3OCR:
     def __init__(self):
@@ -42,10 +42,10 @@ def process_pdf_and_query(pdf_path, question):
     return response
 def chatbot_response(pdf, question):
-    # Speichern der hochgeladenen PDF-Datei auf dem Server
     pdf_path = "uploaded_pdf.pdf"
     with open(pdf_path, "wb") as f:
-        f.write(pdf.read())  # Speichert die hochgeladene PDF-Datei
     # OCR-Textextraktion
     extracted_text = ocr_tool.extract_text(pdf_path)

 from langchain.prompts import PromptTemplate
 from pdf2image import convert_from_path
 import os
+import io  # Für in-memory Dateioperationen
 class LayoutLMv3OCR:
     def __init__(self):
     return response
 def chatbot_response(pdf, question):
+    # Speichern der hochgeladenen PDF-Datei im Arbeitsspeicher
     pdf_path = "uploaded_pdf.pdf"
     with open(pdf_path, "wb") as f:
+        f.write(pdf.file.read())  # Hier wird der Inhalt der hochgeladenen Datei in eine PDF gespeichert
     # OCR-Textextraktion
     extracted_text = ocr_tool.extract_text(pdf_path)