ocr / app.py
GAS17's picture
Update app.py
a5945d2 verified
raw
history blame
940 Bytes
import gradio as gr
import fitz # PyMuPDF
def consultar_pdf(pdf_file, consulta):
# Abrir el archivo PDF
pdf_document = fitz.open(pdf_file.name)
# Recorrer todas las páginas y extraer el texto
texto_completo = ""
for page_num in range(pdf_document.page_count):
page = pdf_document.load_page(page_num)
texto_completo += page.get_text()
# Buscar la consulta dentro del texto extraído
if consulta.lower() in texto_completo.lower():
return f"Consulta encontrada: {consulta}"
else:
return "Consulta no encontrada"
# Crear la interfaz de Gradio
iface = gr.Interface(
fn=consultar_pdf,
inputs=[
gr.File(label="Cargar PDF"), # Entrada para cargar el archivo PDF
gr.Textbox(label="Consulta", default="") # Entrada para la consulta
],
outputs="text" # Salida de texto con el resultado de la consulta
)
# Lanzar la interfaz
iface.launch()