Spaces:

eberhenriquez94
/

OCR

Sleeping

App Files Files Community

eberhenriquez94 commited on Dec 2, 2024

Commit

15a9057

verified ·

1 Parent(s): dd0ed6f

a

Browse files

Files changed (1) hide show

app.py +30 -43

app.py CHANGED Viewed

@@ -5,7 +5,7 @@ from PyPDF2 import PdfReader
 import tempfile
 import os
 import shlex
-from gradio_pdf import PDF
 # Configuración de logs
 logger = logging.getLogger(__name__)
@@ -22,78 +22,65 @@ def ejecutar_comando(comando):
         logger.error(error_message)
         raise RuntimeError(error_message)
-def reparar_pdf(input_pdf, output_pdf):
-    """Repara un PDF usando qpdf."""
-    comando = f"qpdf --linearize {shlex.quote(input_pdf)} {shlex.quote(output_pdf)}"
-    try:
-        ejecutar_comando(comando)
-    except RuntimeError as e:
-        raise gr.Error(f"Error al reparar el PDF: {e}")
-def simplificar_pdf(input_pdf, output_pdf):
-    """Simplifica un PDF usando Ghostscript."""
-    comando = f"gs -sDEVICE=pdfwrite -dCompatibilityLevel=1.4 -dPDFSETTINGS=/screen -dNOPAUSE -dBATCH -sOutputFile={shlex.quote(output_pdf)} {shlex.quote(input_pdf)}"
-    try:
-        ejecutar_comando(comando)
-    except RuntimeError as e:
-        raise gr.Error(f"Error al simplificar el PDF: {e}")
 def crear_pdf_con_texto_incrustado(pdf_original, archivo_salida, idioma="spa"):
     """Procesa un PDF con OCR usando OCRmyPDF."""
     comando = f"ocrmypdf -l {idioma} --force-ocr --deskew --output-type pdf {shlex.quote(pdf_original)} {shlex.quote(archivo_salida)}"
-    try:
-        ejecutar_comando(comando)
-    except RuntimeError as e:
-        raise gr.Error(f"Error al procesar el archivo con OCR: {e}")
 def flujo_principal(pdf_file, idioma="spa"):
-    """Procesa un PDF subido con reparación, simplificación y OCR."""
     if not pdf_file:
         raise gr.Error("No se subió ningún archivo.")
     input_pdf = pdf_file
-    reparado_pdf = tempfile.NamedTemporaryFile(delete=False, suffix=".pdf").name
-    simplificado_pdf = tempfile.NamedTemporaryFile(delete=False, suffix=".pdf").name
     output_pdf = tempfile.NamedTemporaryFile(delete=False, suffix=".pdf").name
     try:
-        # Reparar el PDF
-        reparar_pdf(input_pdf, reparado_pdf)
-        # Simplificar el PDF
-        simplificar_pdf(reparado_pdf, simplificado_pdf)
         # Procesar con OCR
-        crear_pdf_con_texto_incrustado(simplificado_pdf, output_pdf, idioma)
-        return input_pdf, output_pdf
     except gr.Error as e:
         logger.error("Error durante el procesamiento del PDF.")
         raise e
-    finally:
-        # Limpiar archivos temporales
-        for temp_file in [reparado_pdf, simplificado_pdf]:
-            if os.path.exists(temp_file):
-                os.remove(temp_file)
 # Interfaz Gradio mejorada
 with gr.Blocks() as interfaz:
     gr.Markdown("## Visualizador de PDFs con OCR")
     with gr.Row():
-        archivo_pdf = PDF(label="Sube tu archivo PDF")
         idioma_ocr = gr.Dropdown(["spa", "eng", "fra", "deu"], label="Idioma OCR", value="spa")
         boton_procesar = gr.Button("Procesar OCR")
     with gr.Row():
-        pdf_original_vista = PDF(label="PDF Original", interactive=False)
-        pdf_ocr_vista = PDF(label="PDF con OCR", interactive=False)
     boton_procesar.click(
         fn=flujo_principal,
         inputs=[archivo_pdf, idioma_ocr],
-        outputs=[pdf_original_vista, pdf_ocr_vista]
     )
 if __name__ == "__main__":
-    interfaz.launch()

 import tempfile
 import os
 import shlex
+from pdf2image import convert_from_path
 # Configuración de logs
 logger = logging.getLogger(__name__)
         logger.error(error_message)
         raise RuntimeError(error_message)
 def crear_pdf_con_texto_incrustado(pdf_original, archivo_salida, idioma="spa"):
     """Procesa un PDF con OCR usando OCRmyPDF."""
     comando = f"ocrmypdf -l {idioma} --force-ocr --deskew --output-type pdf {shlex.quote(pdf_original)} {shlex.quote(archivo_salida)}"
+    ejecutar_comando(comando)
 def flujo_principal(pdf_file, idioma="spa"):
+    """Procesa un PDF subido con OCR."""
     if not pdf_file:
         raise gr.Error("No se subió ningún archivo.")
     input_pdf = pdf_file
     output_pdf = tempfile.NamedTemporaryFile(delete=False, suffix=".pdf").name
     try:
         # Procesar con OCR
+        crear_pdf_con_texto_incrustado(input_pdf, output_pdf, idioma)
+        return f"/pdfs/{os.path.basename(input_pdf)}", f"/pdfs/{os.path.basename(output_pdf)}"
     except gr.Error as e:
         logger.error("Error durante el procesamiento del PDF.")
         raise e
+def mostrar_paginas(pdf_path):
+    """Genera imágenes por página de un PDF."""
+    pages = convert_from_path(pdf_path, dpi=150)
+    temp_images = []
+    for page in pages:
+        temp_file = tempfile.NamedTemporaryFile(delete=False, suffix=".png")
+        page.save(temp_file.name, "PNG")
+        temp_images.append(temp_file.name)
+    return temp_images
 # Interfaz Gradio mejorada
 with gr.Blocks() as interfaz:
     gr.Markdown("## Visualizador de PDFs con OCR")
     with gr.Row():
+        archivo_pdf = gr.File(label="Sube tu archivo PDF")
         idioma_ocr = gr.Dropdown(["spa", "eng", "fra", "deu"], label="Idioma OCR", value="spa")
         boton_procesar = gr.Button("Procesar OCR")
     with gr.Row():
+        pdf_original = gr.HTML(label="Visualización PDF Original")
+        pdf_procesado = gr.HTML(label="Visualización PDF Procesado")
+    with gr.Row():
+        imagenes_pdf = gr.Gallery(label="Páginas del PDF")
     boton_procesar.click(
         fn=flujo_principal,
         inputs=[archivo_pdf, idioma_ocr],
+        outputs=[pdf_original, pdf_procesado]
+    )
+    boton_procesar.click(
+        fn=mostrar_paginas,
+        inputs=[archivo_pdf],
+        outputs=[imagenes_pdf]
     )
 if __name__ == "__main__":
+    interfaz.launch()