pdf-extractor / app.py
kryman27's picture
Update app.py
7bd59d8 verified
raw
history blame
872 Bytes
import gradio as gr
from magic_pdf import MagicPDF
def extract_info(pdf_file):
# Inicjalizacja MagicPDF
pdf_processor = MagicPDF()
# Przetwarzanie pliku PDF
result = pdf_processor(pdf_file.name)
# Wyodrębnianie pożądanych informacji
extracted_data = {
"company_name": result.get("company_name", "Nie znaleziono"),
"invoice_number": result.get("invoice_number", "Nie znaleziono"),
# Dodaj inne pola według potrzeb
}
return extracted_data
# Interfejs użytkownika
iface = gr.Interface(
fn=extract_info,
inputs=gr.inputs.File(label="Wybierz plik PDF"),
outputs=gr.outputs.JSON(label="Wyodrębnione informacje"),
title="Ekstrakcja informacji z faktur PDF",
description="Prześlij plik PDF z fakturą, aby wyodrębnić określone informacje."
)
if __name__ == "__main__":
iface.launch()