KIMOSSINO commited on
Commit
3d4c5be
·
verified ·
1 Parent(s): 8de157c

Update app.py

Browse files
Files changed (1) hide show
  1. app.py +11 -6
app.py CHANGED
@@ -18,17 +18,22 @@ def process_file(file):
18
  data = []
19
  hashtags_counter = Counter()
20
 
21
- # العثور على العناصر المستهدفة
22
- desc_containers = soup.find_all('div', {'data-e2e': 'user-post-item-desc'})
23
  if not desc_containers:
24
  return "لم يتم العثور على أي بيانات مطابقة في الملف.", None
25
 
26
- for desc_container in desc_containers:
27
  # استخراج العنوان
28
- title = desc_container.get('aria-label', '').strip()
 
29
 
30
  # استخراج الهاشتاغات
31
- hashtags = [tag.get_text().strip() for tag in desc_container.find_all('a') if tag.get_text().startswith('#')]
 
 
 
 
32
  hashtags_counter.update(hashtags)
33
 
34
  # إضافة البيانات للجدول
@@ -48,7 +53,7 @@ def gradio_interface(file):
48
  titles_df, hashtags_df = result
49
  else:
50
  return result, ""
51
-
52
  if titles_df is None or hashtags_df is None:
53
  return "لم يتم استخراج أي بيانات.", ""
54
 
 
18
  data = []
19
  hashtags_counter = Counter()
20
 
21
+ # العثور على الحاويات المستهدفة
22
+ desc_containers = soup.find_all('div', class_="css-vi46v1-DivDesContainer")
23
  if not desc_containers:
24
  return "لم يتم العثور على أي بيانات مطابقة في الملف.", None
25
 
26
+ for container in desc_containers:
27
  # استخراج العنوان
28
+ title_tag = container.find('h1')
29
+ title = title_tag.get_text(strip=True) if title_tag else "بدون عنوان"
30
 
31
  # استخراج الهاشتاغات
32
+ hashtags = [
33
+ tag.get_text(strip=True)
34
+ for tag in container.find_all('a')
35
+ if tag.get_text(strip=True).startswith('#')
36
+ ]
37
  hashtags_counter.update(hashtags)
38
 
39
  # إضافة البيانات للجدول
 
53
  titles_df, hashtags_df = result
54
  else:
55
  return result, ""
56
+
57
  if titles_df is None or hashtags_df is None:
58
  return "لم يتم استخراج أي بيانات.", ""
59