Spaces:
Sleeping
Sleeping
Update main.py
Browse files
main.py
CHANGED
@@ -157,9 +157,9 @@ async def convert_to_accessible_html(input_filename, ext, base_filename, image_c
|
|
157 |
html_content = f.read()
|
158 |
try:
|
159 |
doc = Document(html_content)
|
160 |
-
|
161 |
-
main_text = doc.content() # Extrait le contenu texte complet
|
162 |
-
html_content = f"<html><body><p>{main_text}</p></body></html>"
|
163 |
logging.debug("Contenu HTML nettoyé avec readability-lxml.")
|
164 |
except Exception as e:
|
165 |
logging.error(f"Erreur lors du nettoyage avec readability-lxml : {str(e)}")
|
|
|
157 |
html_content = f.read()
|
158 |
try:
|
159 |
doc = Document(html_content)
|
160 |
+
html_content = doc.summary() # Extrait le HTML principal
|
161 |
+
#main_text = doc.content() # Extrait le contenu texte complet
|
162 |
+
#html_content = f"<html><body><p>{main_text}</p></body></html>"
|
163 |
logging.debug("Contenu HTML nettoyé avec readability-lxml.")
|
164 |
except Exception as e:
|
165 |
logging.error(f"Erreur lors du nettoyage avec readability-lxml : {str(e)}")
|