webmetaextractor

Runtime error

App Files Files Community

zvl commited on Feb 17

Commit

83c013e

verified ·

1 Parent(s): 501b995

Update app.py

Browse files

Files changed (1) hide show

app.py +10 -17

app.py CHANGED Viewed

@@ -24,17 +24,16 @@ model = HfApiModel(
 @tool
 def save_scraped_data_as_markdown(scraped_data: dict, filename: str = None) -> str:
     """
-    Convierte el contenido scrapeado en un archivo Markdown bien estructurado.
-    Args:
-        scraped_data (dict): Un diccionario con la URL y los datos extraídos de una página web.
-            Debe contener las claves:
-            - 'url' (str): La URL de la página web.
-            - 'scraped_data' (list[str]): Lista de fragmentos de texto extraídos de la página.
-        filename (str, opcional): Nombre del archivo de salida. Si no se especifica, se genera automáticamente con timestamp.
-    Returns:
-        str: Mensaje confirmando la creación del archivo Markdown o un error si falla el proceso.
     """
     try:
         url = scraped_data.get("url", "Desconocido")
@@ -45,19 +44,12 @@ def save_scraped_data_as_markdown(scraped_data: dict, filename: str = None) -> s
         formatted_content = "\n\n".join(content_list)
-        # Resumir el contenido si es muy largo
-        if len(formatted_content.split()) > 100:
-            summarized_text = summarize_text(formatted_content[:1024])
-        else:
-            summarized_text = formatted_content
         # Estructurar en Markdown
         markdown_content = f"# Contenido extraído de {url}\n\n"
-        markdown_content += f"## Resumen\n\n> {summarized_text}\n\n"
         markdown_content += "## Contenido Completo\n\n"
         markdown_content += formatted_content
-        # Guardar el archivo con timestamp
         if not filename:
             timestamp = datetime.datetime.now().strftime("%Y%m%d_%H%M%S")
             filename = f"scraped_{timestamp}.md"
@@ -71,6 +63,7 @@ def save_scraped_data_as_markdown(scraped_data: dict, filename: str = None) -> s
         return f"Error al generar el archivo Markdown: {str(e)}"
 @tool
 def summarize_text(text):

 @tool
 def save_scraped_data_as_markdown(scraped_data: dict, filename: str = None) -> str:
     """
+    Guarda el contenido scrapeado en un archivo Markdown.
+    Parámetros:
+        scraped_data (dict): Diccionario con los siguientes datos:
+            - url (str): URL de la página web de donde se extrajo el contenido.
+            - scraped_data (list[str]): Lista de fragmentos de texto extraídos de la página.
+        filename (str, opcional): Nombre del archivo Markdown a guardar. Si no se proporciona, se generará un nombre automáticamente.
+    Retorna:
+        str: Mensaje indicando si el archivo fue guardado correctamente o si ocurrió un error.
     """
     try:
         url = scraped_data.get("url", "Desconocido")
         formatted_content = "\n\n".join(content_list)
         # Estructurar en Markdown
         markdown_content = f"# Contenido extraído de {url}\n\n"
         markdown_content += "## Contenido Completo\n\n"
         markdown_content += formatted_content
+        # Generar nombre con timestamp si no se proporciona
         if not filename:
             timestamp = datetime.datetime.now().strftime("%Y%m%d_%H%M%S")
             filename = f"scraped_{timestamp}.md"
         return f"Error al generar el archivo Markdown: {str(e)}"
 @tool
 def summarize_text(text):