Bentham commited on
Commit
a1a2e31
·
verified ·
1 Parent(s): f8a0705

Update main.py

Browse files
Files changed (1) hide show
  1. main.py +3 -3
main.py CHANGED
@@ -157,9 +157,9 @@ async def convert_to_accessible_html(input_filename, ext, base_filename, image_c
157
  html_content = f.read()
158
  try:
159
  doc = Document(html_content)
160
- main_html = doc.summary() # Extrait le HTML principal
161
- main_text = doc.content() # Extrait le contenu texte complet
162
- html_content = f"<html><body><p>{main_text}</p></body></html>"
163
  logging.debug("Contenu HTML nettoyé avec readability-lxml.")
164
  except Exception as e:
165
  logging.error(f"Erreur lors du nettoyage avec readability-lxml : {str(e)}")
 
157
  html_content = f.read()
158
  try:
159
  doc = Document(html_content)
160
+ html_content = doc.summary() # Extrait le HTML principal
161
+ #main_text = doc.content() # Extrait le contenu texte complet
162
+ #html_content = f"<html><body><p>{main_text}</p></body></html>"
163
  logging.debug("Contenu HTML nettoyé avec readability-lxml.")
164
  except Exception as e:
165
  logging.error(f"Erreur lors du nettoyage avec readability-lxml : {str(e)}")