Spaces:

KIMOSSINO
/

hashtags

Sleeping

App Files Files Community

KIMOSSINO commited on Dec 8, 2024

Commit

83d2a51

verified ·

1 Parent(s): 70ed89b

Update app.py

Browse files

Files changed (1) hide show

app.py +7 -12

app.py CHANGED Viewed

@@ -5,24 +5,21 @@ from io import BytesIO
 from docx import Document
 import gradio as gr
-# استخراج العناوين والهاشتاغات
 def extract_titles_and_hashtags(file):
     try:
         # قراءة محتوى الملف
-        try:
-            content = file.read() if hasattr(file, 'read') else open(file.name, 'r', encoding='utf-8').read()
-        except Exception as e:
-            print(f"خطأ في قراءة الملف: {str(e)}")
-            return f"خطأ في قراءة الملف: {str(e)}", None, None
-    # تحليل HTML
     try:
         soup = BeautifulSoup(content, 'html.parser')
         print("تم تحليل HTML بنجاح.")
     except Exception as e:
-        print(f"خطأ في تحليل HTML: {str(e)}")
-        return f"خطأ في تحليل HTML: {str(e)}", None, None
     # استخراج البيانات
     data = []
@@ -36,7 +33,6 @@ def extract_titles_and_hashtags(file):
         return "لم يتم العثور على أي بيانات مطابقة.", None, None
     for container in desc_containers:
-        print(f"الحاوية: {container.prettify()}")  # طباعة محتوى الحاوية لفحصها
         title = container.get('aria-label', 'بدون عنوان')
         hashtags = [
@@ -44,7 +40,6 @@ def extract_titles_and_hashtags(file):
             for tag in container.find_all('a')
             if tag.get_text(strip=True).startswith('#')
         ]
-        print(f"العنوان: {title}, الهاشتاغات: {hashtags}")
         hashtags_counter.update(hashtags)
         data.append({"Title": title, "Hashtags": ", ".join(hashtags)})

 from docx import Document
 import gradio as gr
 def extract_titles_and_hashtags(file):
     try:
         # قراءة محتوى الملف
+        content = file.read() if hasattr(file, 'read') else open(file.name, 'r', encoding='utf-8').read()
+    except Exception as e:
+        print(f"خطأ أثناء قراءة الملف: {str(e)}")
+        return f"خطأ أثناء قراءة الملف: {str(e)}", None, None
     try:
+        # تحليل HTML باستخدام BeautifulSoup
         soup = BeautifulSoup(content, 'html.parser')
         print("تم تحليل HTML بنجاح.")
     except Exception as e:
+        print(f"خطأ أثناء تحليل HTML: {str(e)}")
+        return f"خطأ أثناء تحليل HTML: {str(e)}", None, None
     # استخراج البيانات
     data = []
         return "لم يتم العثور على أي بيانات مطابقة.", None, None
     for container in desc_containers:
         title = container.get('aria-label', 'بدون عنوان')
         hashtags = [
             for tag in container.find_all('a')
             if tag.get_text(strip=True).startswith('#')
         ]
         hashtags_counter.update(hashtags)
         data.append({"Title": title, "Hashtags": ", ".join(hashtags)})