accessibility

Sleeping

App Files Files Community

Bentham commited on Dec 19, 2024

Commit

af461e5

verified ·

1 Parent(s): 76171bc

bug convert to txt

Browse files

Files changed (1) hide show

main.py +19 -9

main.py CHANGED Viewed

@@ -805,8 +805,10 @@ async def convert_file_to_txt(
         output_filename = os.path.join(tempfile.gettempdir(), f"{base_filename}_{unique_id}.txt")
         text = ""
-        # MODIFICATIONS START: Extraction du texte et des images
-        images_data = {}
         if ext == '.pdf':
             text, images = extract_text_with_image_markers(input_filename)
         elif ext == '.pptx':
@@ -838,10 +840,8 @@ async def convert_file_to_txt(
                 text = f.read()
             images = []
-        # Analyse des images
-        # On récupère les descriptions des images
         if images:
-            image_descriptions = {}
             tasks = []
             for img_num, img_bytes in images:
                 base64_image = base64.b64encode(img_bytes).decode('utf-8')
@@ -852,10 +852,13 @@ async def convert_file_to_txt(
                     )
                 ))
-            descriptions = await asyncio.gather(*tasks)
             for (img_num, _), desc in zip(images, descriptions):
-                if desc and desc != "Description indisponible.":
                     image_descriptions[img_num] = desc
                 else:
                     image_descriptions[img_num] = "Description indisponible."
@@ -865,8 +868,8 @@ async def convert_file_to_txt(
                 marker = f"[IMG_{img_num}]"
                 description_text = f"Image {img_num}: {desc}"
                 text = text.replace(marker, description_text)
-        # MODIFICATIONS END
         with open(output_filename, "w", encoding="utf-8") as f:
             f.write(text)
@@ -879,4 +882,11 @@ async def convert_file_to_txt(
             temp_files_to_delete.append(cleaned_input_filename)
         background_tasks.add_task(delete_temp_files, temp_files_to_delete)
-        return FileResponse(output_filename, filename=f"{base_filename}.txt")

         output_filename = os.path.join(tempfile.gettempdir(), f"{base_filename}_{unique_id}.txt")
         text = ""
+        images = []
+        image_descriptions = {}
+        # Extraction du texte et des images
         if ext == '.pdf':
             text, images = extract_text_with_image_markers(input_filename)
         elif ext == '.pptx':
                 text = f.read()
             images = []
+        # Analyse des images et récupération des descriptions
         if images:
             tasks = []
             for img_num, img_bytes in images:
                 base64_image = base64.b64encode(img_bytes).decode('utf-8')
                     )
                 ))
+            descriptions = await asyncio.gather(*tasks, return_exceptions=True)
             for (img_num, _), desc in zip(images, descriptions):
+                if isinstance(desc, Exception):
+                    logging.error(f"Erreur lors de la description de l'image {img_num} : {str(desc)}")
+                    image_descriptions[img_num] = "Description indisponible."
+                elif desc and desc != "Description indisponible.":
                     image_descriptions[img_num] = desc
                 else:
                     image_descriptions[img_num] = "Description indisponible."
                 marker = f"[IMG_{img_num}]"
                 description_text = f"Image {img_num}: {desc}"
                 text = text.replace(marker, description_text)
+        # Écriture du texte dans le fichier de sortie
         with open(output_filename, "w", encoding="utf-8") as f:
             f.write(text)
             temp_files_to_delete.append(cleaned_input_filename)
         background_tasks.add_task(delete_temp_files, temp_files_to_delete)
+        return FileResponse(output_filename, filename=f"{base_filename}.txt")
+    except HTTPException as http_exc:
+        logging.error(f"Erreur HTTP lors de la conversion : {str(http_exc.detail)}")
+        return JSONResponse(status_code=http_exc.status_code, content={"message": http_exc.detail})
+    except Exception as e:
+        logging.error(f"Erreur interne lors de la conversion : {str(e)}")
+        return JSONResponse(status_code=500, content={"message": f"Erreur interne : {str(e)}"})