Spaces:
Running
Running
import gradio as gr | |
from magic_pdf import MagicPDF | |
def extract_info(pdf_file): | |
# Inicjalizacja MagicPDF | |
pdf_processor = MagicPDF() | |
# Przetwarzanie pliku PDF | |
result = pdf_processor(pdf_file.name) | |
# Wyodrębnianie pożądanych informacji | |
extracted_data = { | |
"company_name": result.get("company_name", "Nie znaleziono"), | |
"invoice_number": result.get("invoice_number", "Nie znaleziono"), | |
# Dodaj inne pola według potrzeb | |
} | |
return extracted_data | |
# Interfejs użytkownika | |
iface = gr.Interface( | |
fn=extract_info, | |
inputs=gr.inputs.File(label="Wybierz plik PDF"), | |
outputs=gr.outputs.JSON(label="Wyodrębnione informacje"), | |
title="Ekstrakcja informacji z faktur PDF", | |
description="Prześlij plik PDF z fakturą, aby wyodrębnić określone informacje." | |
) | |
if __name__ == "__main__": | |
iface.launch() | |