ocr / app.py
GAS17's picture
Update app.py
3a06806 verified
raw
history blame
838 Bytes
import gradio as gr
import fitz # PyMuPDF
def consultar_pdf(pdf_file, consulta):
# Abrir el archivo PDF
pdf_document = fitz.open(pdf_file.name)
# Recorrer todas las páginas y extraer el texto
texto_completo = ""
for page_num in range(pdf_document.page_count):
page = pdf_document.load_page(page_num)
texto_completo += page.get_text()
# Devolver el texto completo del documento
return texto_completo
# Crear la interfaz de Gradio
iface = gr.Interface(
fn=consultar_pdf,
inputs=[
gr.File(label="Cargar PDF"), # Entrada para cargar el archivo PDF
gr.Textbox(label="Consulta", placeholder="Escribe tu consulta aquí") # Entrada para la consulta
],
outputs="text" # Salida de texto con el resultado de la consulta
)
# Lanzar la interfaz
iface.launch()