Spaces:

la04
/

RAG_test_1

Sleeping

la04 commited on Jan 9

Commit

692eafb

verified ·

1 Parent(s): 1678ad7

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,5 +1,5 @@
 import gradio as gr
-from langchain_community.vectorstores import Chroma  # Import angepasst
 from langchain_community.document_loaders import PyPDFLoader
 from langchain_community.embeddings import HuggingFaceEmbeddings
 from transformers import LayoutLMv3Processor, AutoModelForTokenClassification
@@ -41,25 +41,23 @@ def process_pdf_and_query(pdf_path, question):
     return response
 def chatbot_response(pdf, question):
-    # Speichern der hochgeladenen PDF-Datei im Arbeitsspeicher
-    pdf_path = "uploaded_pdf.pdf"
-    # 'pdf' ist ein NamedString-Objekt. Wir müssen den Inhalt extrahieren und speichern
     with open(pdf_path, "wb") as f:
-        f.write(pdf.read())  # Wir lesen die Datei als Byte-Stream und speichern sie
-    # OCR-Textextraktion
     extracted_text = ocr_tool.extract_text(pdf_path)
-    # Beantwortung der Frage basierend auf dem Dokument
     answer = process_pdf_and_query(pdf_path, question)
-    # Löschen der temporären Datei nach der Verarbeitung
     os.remove(pdf_path)
     return answer
-# Gradio-Interface mit der neuen API
 pdf_input = gr.File(label="PDF-Datei hochladen")
 question_input = gr.Textbox(label="Frage eingeben")
 response_output = gr.Textbox(label="Antwort")
@@ -73,4 +71,4 @@ interface = gr.Interface(
 )
 if __name__ == "__main__":
-    interface.launch(share=False)  # Kein öffentlicher Link, nur lokal

 import gradio as gr
+from langchain.vectorstores import Chroma
 from langchain_community.document_loaders import PyPDFLoader
 from langchain_community.embeddings import HuggingFaceEmbeddings
 from transformers import LayoutLMv3Processor, AutoModelForTokenClassification
     return response
 def chatbot_response(pdf, question):
+    # Wir speichern die hochgeladene PDF-Datei als temporäre Datei
+    pdf_path = "/tmp/uploaded_pdf.pdf"
     with open(pdf_path, "wb") as f:
+        f.write(pdf.read())  # PDF-Inhalt als Byte-Stream speichern
+    # OCR-Text extrahieren
     extracted_text = ocr_tool.extract_text(pdf_path)
+    # Frage beantworten basierend auf der PDF und OCR-Inhalten
     answer = process_pdf_and_query(pdf_path, question)
+    # Temporäre Datei löschen
     os.remove(pdf_path)
     return answer
+# Ändere 'inputs' und 'outputs' zur neuen Gradio API
 pdf_input = gr.File(label="PDF-Datei hochladen")
 question_input = gr.Textbox(label="Frage eingeben")
 response_output = gr.Textbox(label="Antwort")
 )
 if __name__ == "__main__":
+    interface.launch()