accessibility

Sleeping

App Files Files Community

Bentham commited on Dec 19, 2024

Commit

9274fa3

verified ·

1 Parent(s): 4394122

Update main.py

Browse files

Files changed (1) hide show

main.py +33 -34

main.py CHANGED Viewed

@@ -399,7 +399,7 @@ def markdown_to_html(markdown_text: str) -> str:
 # On rend le prompt pour get_image_description paramétrable
 async def get_image_description(base64_image: str, prompt: str) -> str:
     try:
-        # Intégrer l'image dans le contenu en utilisant Markdown
         content = f"{prompt}\n\n![Image](data:image/jpeg;base64,{base64_image})"
         logging.debug(f"Contenu envoyé à l'API OpenAI : {content}")
@@ -414,6 +414,10 @@ async def get_image_description(base64_image: str, prompt: str) -> str:
         )
         logging.debug(f"Réponse de l'API OpenAI : {response}")
         description = response.choices[0].message.content.strip()
         logging.debug(f"Description obtenue : {description}")
         return description
@@ -422,6 +426,7 @@ async def get_image_description(base64_image: str, prompt: str) -> str:
         return "Description indisponible."
 # MODIFICATIONS END
 async def rewrite_html_accessible(html_content: str) -> str:
@@ -756,10 +761,10 @@ def extract_images_from_pdf(input_filename: str) -> List[bytes]:
 def extract_text_with_image_markers(input_filename: str) -> Tuple[str, List[Tuple[int, bytes]]]:
     """
     Extrait le texte d'un PDF en insérant des marqueurs pour les images.
     Args:
         input_filename (str): Chemin vers le fichier PDF.
     Returns:
         Tuple[str, List[Tuple[int, bytes]]]: Le texte extrait avec des marqueurs et une liste d'images extraites.
     """
@@ -767,38 +772,33 @@ def extract_text_with_image_markers(input_filename: str) -> Tuple[str, List[Tupl
     images = []
     with fitz.open(input_filename) as doc:
         for page_num, page in enumerate(doc, start=1):
-            page_json = page.get_text("json")
-            try:
-                page_data = json.loads(page_json)  # Parse le JSON en dict
-                blocks = page_data["blocks"]
-                logging.debug(f"Page {page_num} blocs: {len(blocks)}")
-            except json.JSONDecodeError as e:
-                logging.error(f"Erreur de décodage JSON sur la page {page_num}: {str(e)}")
-                continue  # Passe à la page suivante en cas d'erreur
-            for block in blocks:
-                if block['type'] == 0:  # Texte
-                    for line in block.get('lines', []):
-                        for span in line.get('spans', []):
-                            text += span.get('text', '') + ' '
-                        text += '\n'  # Saut de ligne après chaque ligne de texte
-                elif block['type'] == 1:  # Image
-                    # Insérer un marqueur unique pour l'image
                     img_num = len(images) + 1
                     marker = f"[IMG_{img_num}]"
-                    text += marker + '\n'  # Saut de ligne après le marqueur d'image
-                    # Extraire l'image
-                    xref = block.get('xref')
-                    if xref is not None:
-                        try:
-                            base_image = doc.extract_image(xref)
-                            image_bytes = base_image["image"]
-                            images.append((img_num, image_bytes))
-                            logging.debug(f"Image {img_num} extraite de la page {page_num}.")
-                        except Exception as e:
-                            logging.error(f"Erreur lors de l'extraction de l'image xref={xref} sur la page {page_num} : {str(e)}")
-        logging.debug(f"Total text length: {len(text)} characters.")
-        logging.debug(f"Total images extracted: {len(images)}.")
     return text, images
@@ -929,7 +929,6 @@ async def convert_file_to_txt(
                 description_text = f"Image {img_num}: {desc}"
                 text = text.replace(marker, description_text)
             logging.debug("Remplacement des marqueurs d'images par les descriptions terminé.")
         else:
             logging.debug("Aucune image trouvée. Aucun remplacement de marqueur effectué.")

 # On rend le prompt pour get_image_description paramétrable
 async def get_image_description(base64_image: str, prompt: str) -> str:
     try:
+        # Préparer le contenu avec le prompt et l'image en markdown
         content = f"{prompt}\n\n![Image](data:image/jpeg;base64,{base64_image})"
         logging.debug(f"Contenu envoyé à l'API OpenAI : {content}")
         )
         logging.debug(f"Réponse de l'API OpenAI : {response}")
+        if not response.choices:
+            logging.error("Aucune réponse reçue de l'API OpenAI.")
+            return "Description indisponible."
         description = response.choices[0].message.content.strip()
         logging.debug(f"Description obtenue : {description}")
         return description
         return "Description indisponible."
 # MODIFICATIONS END
 async def rewrite_html_accessible(html_content: str) -> str:
 def extract_text_with_image_markers(input_filename: str) -> Tuple[str, List[Tuple[int, bytes]]]:
     """
     Extrait le texte d'un PDF en insérant des marqueurs pour les images.
     Args:
         input_filename (str): Chemin vers le fichier PDF.
     Returns:
         Tuple[str, List[Tuple[int, bytes]]]: Le texte extrait avec des marqueurs et une liste d'images extraites.
     """
     images = []
     with fitz.open(input_filename) as doc:
         for page_num, page in enumerate(doc, start=1):
+            text += f"<!--PAGE_{page_num}-->\n"
+            # Extraction du texte
+            page_text = page.get_text("text")
+            text += page_text + '\n'
+            # Extraction des images
+            image_list = page.get_images(full=True)
+            for img in image_list:
+                xref = img[0]
+                try:
+                    base_image = doc.extract_image(xref)
+                    image_bytes = base_image["image"]
                     img_num = len(images) + 1
                     marker = f"[IMG_{img_num}]"
+                    text += marker + '\n'
+                    images.append((img_num, image_bytes))
+                    logging.debug(f"Image {img_num} extraite de la page {page_num}.")
+                except Exception as e:
+                    logging.error(f"Erreur lors de l'extraction de l'image xref={xref} sur la page {page_num} : {str(e)}")
+            logging.debug(f"Page {page_num}: {len(images)} images extraites jusqu'à présent.")
+    logging.debug(f"Total text length: {len(text)} caractères.")
+    logging.debug(f"Total images extraites: {len(images)}.")
     return text, images
                 description_text = f"Image {img_num}: {desc}"
                 text = text.replace(marker, description_text)
             logging.debug("Remplacement des marqueurs d'images par les descriptions terminé.")
         else:
             logging.debug("Aucune image trouvée. Aucun remplacement de marqueur effectué.")