eberhenriquez94 commited on
Commit
4888232
verified
1 Parent(s): 0ea50a7
Files changed (1) hide show
  1. app.py +8 -27
app.py CHANGED
@@ -79,7 +79,6 @@ def flujo_principal(pdf_file, idioma="spa"):
79
  if os.path.exists(temp_file):
80
  os.remove(temp_file)
81
 
82
- # Funci贸n para mostrar PDF con iframe y pdf.js (con zoom)
83
  def mostrar_pdf_zoom(pdf_path):
84
  return f"""
85
  <iframe
@@ -89,9 +88,8 @@ def mostrar_pdf_zoom(pdf_path):
89
  style='border: none;'
90
  ></iframe>
91
  """
92
- # Funci贸n para mostrar PDF con iframe y pdf.js (sin zoom)
93
  def mostrar_pdf(pdf_path):
94
- # Genera un iframe que apunta al archivo PDF procesado usando pdf.js
95
  return f"""
96
  <iframe
97
  src='viewer.html?file={pdf_path}'
@@ -101,9 +99,7 @@ def mostrar_pdf(pdf_path):
101
  ></iframe>
102
  """
103
 
104
- # Funci贸n para mostrar p谩ginas como im谩genes con navegaci贸n
105
  def mostrar_paginas(pdf_path):
106
- # Convierte el PDF en im谩genes por p谩gina
107
  pages = convert_from_path(pdf_path, dpi=150)
108
  temp_images = []
109
  for i, page in enumerate(pages):
@@ -112,7 +108,6 @@ def mostrar_paginas(pdf_path):
112
  temp_images.append(temp_file.name)
113
  return temp_images
114
 
115
- # Interfaz Gradio mejorada
116
  with gr.Blocks() as interfaz:
117
  gr.Markdown("## Visualizador de PDFs con OCR")
118
 
@@ -122,26 +117,12 @@ with gr.Blocks() as interfaz:
122
  boton_procesar = gr.Button("Procesar OCR")
123
 
124
  with gr.Row():
125
- pdf_original_vista = PDF(label="PDF Original", height=800, interactive=True, visible=True)
126
- pdf_ocr_vista = gr.HTML(label="PDF con OCR") # Usamos HTML para pdf.js o Gallery para im谩genes
127
-
128
- imagenes = gr.Gallery(label="P谩ginas del PDF").style(columns=[4], object_fit="contain", height="auto") # Galer铆a para mostrar las p谩ginas del PDF como im谩genes
129
-
130
- boton_procesar.click(
131
- fn=flujo_principal,
132
- inputs=[archivo_pdf, idioma_ocr],
133
- outputs=[pdf_original_vista, pdf_ocr_vista]
134
- )
135
- boton_procesar.click(
136
- fn=mostrar_paginas,
137
- inputs=[archivo_pdf],
138
- outputs=[imagenes]
139
- )
140
- boton_procesar.click(
141
- fn=mostrar_pdf_zoom,
142
- inputs = [archivo_pdf],
143
- outputs=[pdf_ocr_vista]
144
- )
145
 
146
  if __name__ == "__main__":
147
- interfaz.launch()
 
79
  if os.path.exists(temp_file):
80
  os.remove(temp_file)
81
 
 
82
  def mostrar_pdf_zoom(pdf_path):
83
  return f"""
84
  <iframe
 
88
  style='border: none;'
89
  ></iframe>
90
  """
91
+
92
  def mostrar_pdf(pdf_path):
 
93
  return f"""
94
  <iframe
95
  src='viewer.html?file={pdf_path}'
 
99
  ></iframe>
100
  """
101
 
 
102
  def mostrar_paginas(pdf_path):
 
103
  pages = convert_from_path(pdf_path, dpi=150)
104
  temp_images = []
105
  for i, page in enumerate(pages):
 
108
  temp_images.append(temp_file.name)
109
  return temp_images
110
 
 
111
  with gr.Blocks() as interfaz:
112
  gr.Markdown("## Visualizador de PDFs con OCR")
113
 
 
117
  boton_procesar = gr.Button("Procesar OCR")
118
 
119
  with gr.Row():
120
+ pdf_original_vista = gr.HTML(label="PDF Original")
121
+ pdf_ocr_vista = gr.HTML(label="PDF con OCR")
122
+ imagenes = gr.Gallery(label="P谩ginas del PDF").style(columns=[4], object_fit="contain", height="auto")
123
+
124
+ boton_procesar.click(fn=flujo_principal, inputs=[archivo_pdf, idioma_ocr], outputs=[pdf_original_vista, pdf_ocr_vista])
125
+ boton_procesar.click(fn=mostrar_paginas, inputs=[archivo_pdf], outputs=[imagenes])
 
 
 
 
 
 
 
 
 
 
 
 
 
 
126
 
127
  if __name__ == "__main__":
128
+ interfaz.launch()