boompack commited on
Commit
bf4724c
·
verified ·
1 Parent(s): cce8ab3

Update app.py

Browse files
Files changed (1) hide show
  1. app.py +14 -36
app.py CHANGED
@@ -25,54 +25,34 @@ def is_spam(text: str) -> bool:
25
  def extract_comment_data(comment_text: str) -> Tuple[Optional[str], Optional[str], int, int]:
26
  """Извлекает данные из комментария"""
27
  try:
28
- if 'отметок "Нравится"' in comment_text:
29
- return None, None, 0, 0
30
-
31
- # Извлекаем имя пользователя (поддержка обоих форматов)
32
- username = None
33
-
34
- # Формат 1: "Фото профиля username\nusername\n"
35
- if "Фото профиля" in comment_text:
36
- username_match = re.search(r"Фото профиля ([^\n]+)", comment_text)
37
- if username_match:
38
- username = username_match.group(1).strip()
39
 
40
- # Формат 2: Прямое указание имени пользователя
41
- else:
42
- lines = comment_text.split('\n')
43
- if lines and lines[0].strip():
44
- username = lines[0].strip()
45
-
46
  if not username:
47
  return None, None, 0, 0
48
 
49
- # Извлекаем текст комментария
50
- lines = comment_text.split('\n')
51
  comment = ""
52
-
53
- # Ищем комментарий после времени
54
  time_pattern = r'\d+\s*(?:ч\.|нед\.)'
55
- for i, line in enumerate(lines):
 
 
56
  if re.search(time_pattern, line):
57
- if i + 1 < len(lines):
58
- comment = lines[i + 1].strip()
59
  break
60
- elif username in line and i + 2 < len(lines):
61
- # Проверяем следующую строку после юзернейма
62
- next_line = lines[i + 1].strip()
63
- if not re.search(time_pattern, next_line):
64
- comment = next_line
65
- break
66
 
67
- # Очищаем комментарий
68
  comment = re.sub(r'\d+\s*(?:ч\.|нед\.)\s*$', '', comment)
69
  comment = re.sub(r'"Нравится":\s*\d+\s*Ответить\s*$', '', comment)
70
 
71
- # Извлекаем лайки
72
  likes_match = re.search(r'"Нравится":\s*(\d+)', comment_text)
73
  likes = int(likes_match.group(1)) if likes_match else 0
74
 
75
- # Извлекаем время
76
  time_match = re.search(r'(\d+)\s*(?:ч\.|нед\.)', comment_text)
77
  time = int(time_match.group(1)) if time_match else 0
78
 
@@ -133,18 +113,15 @@ def analyze_post(content_type: str, link: str, post_likes: int,
133
 
134
  analytics = f"""
135
  📊 Подробный анализ комментариев:
136
-
137
  Основные метрики:
138
  • Всего комментариев: {total_comments}
139
  • Уникальных пользователей: {unique_users}
140
  • Общее количество лайков: {total_likes}
141
  • Среднее количество лайков: {avg_likes:.1f}
142
-
143
  Дополнительная информация:
144
  • Использовано эмодзи: {total_emojis}
145
  • Количество упоминаний: {len(mentions)}
146
  • Выявлено спам-комментариев: {spam_count}
147
-
148
  Топ комментаторы:
149
  {chr(10).join(f'• {user}: {count} комментария' for user, count in top_commenters if count > 1)}
150
  """
@@ -210,6 +187,7 @@ iface = gr.Interface(
210
  description="Анализатор комментариев Instagram с расширенной аналитикой",
211
  theme="default"
212
  )
 
213
  if __name__ == "__main__":
214
  try:
215
  iface.launch(
 
25
  def extract_comment_data(comment_text: str) -> Tuple[Optional[str], Optional[str], int, int]:
26
  """Извлекает данные из комментария"""
27
  try:
28
+ # Extract username
29
+ username_match = re.search(r'Фото профиля\s+(.+?)\n', comment_text)
30
+ username = username_match.group(1).strip() if username_match else None
 
 
 
 
 
 
 
 
31
 
 
 
 
 
 
 
32
  if not username:
33
  return None, None, 0, 0
34
 
35
+ # Extract comment text
36
+ comment_lines = comment_text.split('\n')
37
  comment = ""
 
 
38
  time_pattern = r'\d+\s*(?:ч\.|нед\.)'
39
+
40
+ # Identify where the comment text starts
41
+ for i, line in enumerate(comment_lines):
42
  if re.search(time_pattern, line):
43
+ if i + 1 < len(comment_lines):
44
+ comment = comment_lines[i + 1].strip()
45
  break
 
 
 
 
 
 
46
 
47
+ # Clean up comment text
48
  comment = re.sub(r'\d+\s*(?:ч\.|нед\.)\s*$', '', comment)
49
  comment = re.sub(r'"Нравится":\s*\d+\s*Ответить\s*$', '', comment)
50
 
51
+ # Extract likes
52
  likes_match = re.search(r'"Нравится":\s*(\d+)', comment_text)
53
  likes = int(likes_match.group(1)) if likes_match else 0
54
 
55
+ # Extract time
56
  time_match = re.search(r'(\d+)\s*(?:ч\.|нед\.)', comment_text)
57
  time = int(time_match.group(1)) if time_match else 0
58
 
 
113
 
114
  analytics = f"""
115
  📊 Подробный анализ комментариев:
 
116
  Основные метрики:
117
  • Всего комментариев: {total_comments}
118
  • Уникальных пользователей: {unique_users}
119
  • Общее количество лайков: {total_likes}
120
  • Среднее количество лайков: {avg_likes:.1f}
 
121
  Дополнительная информация:
122
  • Использовано эмодзи: {total_emojis}
123
  • Количество упоминаний: {len(mentions)}
124
  • Выявлено спам-комментариев: {spam_count}
 
125
  Топ комментаторы:
126
  {chr(10).join(f'• {user}: {count} комментария' for user, count in top_commenters if count > 1)}
127
  """
 
187
  description="Анализатор комментариев Instagram с расширенной аналитикой",
188
  theme="default"
189
  )
190
+
191
  if __name__ == "__main__":
192
  try:
193
  iface.launch(