MistralRAG

Runtime error

desarrolloasesoreslocales commited on Nov 3, 2023

Commit

0d5c6ec

1 Parent(s): b1e68da

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -16,8 +16,8 @@ from PIL import Image
 #print('HOLA:', os.walk('../'))
-pytesseract.pytesseract.tesseract_cmd = r"./lib/Tesseract-OCR/tesseract.exe"
-path_to_poppler_exe = r"./lib/poppler-0.68.0/bin"
 def ocrtotext(filename):
     # Almacena todas las páginas del PDF en una variable
@@ -26,7 +26,8 @@ def ocrtotext(filename):
     text_file = (f'{filename}.txt')  # Nombre del archivo de texto de salida
     # Parte #1: Convirtiendo el PDF a imágenes
-    pdf_pages = convert_from_path(PDF_file, 300, poppler_path=path_to_poppler_exe)
     # Lee el archivo PDF a 300 DPI
     # Itera a través de todas las páginas almacenadas arriba

 #print('HOLA:', os.walk('../'))
+#pytesseract.pytesseract.tesseract_cmd = r"./lib/Tesseract-OCR/tesseract.exe"
+#path_to_poppler_exe = r"./lib/poppler-0.68.0/bin"
 def ocrtotext(filename):
     # Almacena todas las páginas del PDF en una variable
     text_file = (f'{filename}.txt')  # Nombre del archivo de texto de salida
     # Parte #1: Convirtiendo el PDF a imágenes
+    #pdf_pages = convert_from_path(PDF_file, 300, poppler_path=path_to_poppler_exe)
+    pdf_pages = convert_from_path(PDF_file, 300)
     # Lee el archivo PDF a 300 DPI
     # Itera a través de todas las páginas almacenadas arriba