Update app.py
Browse files
app.py
CHANGED
@@ -25,54 +25,34 @@ def is_spam(text: str) -> bool:
|
|
25 |
def extract_comment_data(comment_text: str) -> Tuple[Optional[str], Optional[str], int, int]:
|
26 |
"""Извлекает данные из комментария"""
|
27 |
try:
|
28 |
-
|
29 |
-
|
30 |
-
|
31 |
-
# Извлекаем имя пользователя (поддержка обоих форматов)
|
32 |
-
username = None
|
33 |
-
|
34 |
-
# Формат 1: "Фото профиля username\nusername\n"
|
35 |
-
if "Фото профиля" in comment_text:
|
36 |
-
username_match = re.search(r"Фото профиля ([^\n]+)", comment_text)
|
37 |
-
if username_match:
|
38 |
-
username = username_match.group(1).strip()
|
39 |
|
40 |
-
# Формат 2: Прямое указание имени пользователя
|
41 |
-
else:
|
42 |
-
lines = comment_text.split('\n')
|
43 |
-
if lines and lines[0].strip():
|
44 |
-
username = lines[0].strip()
|
45 |
-
|
46 |
if not username:
|
47 |
return None, None, 0, 0
|
48 |
|
49 |
-
#
|
50 |
-
|
51 |
comment = ""
|
52 |
-
|
53 |
-
# Ищем комментарий после времени
|
54 |
time_pattern = r'\d+\s*(?:ч\.|нед\.)'
|
55 |
-
|
|
|
|
|
56 |
if re.search(time_pattern, line):
|
57 |
-
if i + 1 < len(
|
58 |
-
comment =
|
59 |
break
|
60 |
-
elif username in line and i + 2 < len(lines):
|
61 |
-
# Проверяем следующую строку после юзернейма
|
62 |
-
next_line = lines[i + 1].strip()
|
63 |
-
if not re.search(time_pattern, next_line):
|
64 |
-
comment = next_line
|
65 |
-
break
|
66 |
|
67 |
-
#
|
68 |
comment = re.sub(r'\d+\s*(?:ч\.|нед\.)\s*$', '', comment)
|
69 |
comment = re.sub(r'"Нравится":\s*\d+\s*Ответить\s*$', '', comment)
|
70 |
|
71 |
-
#
|
72 |
likes_match = re.search(r'"Нравится":\s*(\d+)', comment_text)
|
73 |
likes = int(likes_match.group(1)) if likes_match else 0
|
74 |
|
75 |
-
#
|
76 |
time_match = re.search(r'(\d+)\s*(?:ч\.|нед\.)', comment_text)
|
77 |
time = int(time_match.group(1)) if time_match else 0
|
78 |
|
@@ -133,18 +113,15 @@ def analyze_post(content_type: str, link: str, post_likes: int,
|
|
133 |
|
134 |
analytics = f"""
|
135 |
📊 Подробный анализ комментариев:
|
136 |
-
|
137 |
Основные метрики:
|
138 |
• Всего комментариев: {total_comments}
|
139 |
• Уникальных пользователей: {unique_users}
|
140 |
• Общее количество лайков: {total_likes}
|
141 |
• Среднее количество лайков: {avg_likes:.1f}
|
142 |
-
|
143 |
Дополнительная информация:
|
144 |
• Использовано эмодзи: {total_emojis}
|
145 |
• Количество упоминаний: {len(mentions)}
|
146 |
• Выявлено спам-комментариев: {spam_count}
|
147 |
-
|
148 |
Топ комментаторы:
|
149 |
{chr(10).join(f'• {user}: {count} комментария' for user, count in top_commenters if count > 1)}
|
150 |
"""
|
@@ -210,6 +187,7 @@ iface = gr.Interface(
|
|
210 |
description="Анализатор комментариев Instagram с расширенной аналитикой",
|
211 |
theme="default"
|
212 |
)
|
|
|
213 |
if __name__ == "__main__":
|
214 |
try:
|
215 |
iface.launch(
|
|
|
25 |
def extract_comment_data(comment_text: str) -> Tuple[Optional[str], Optional[str], int, int]:
|
26 |
"""Извлекает данные из комментария"""
|
27 |
try:
|
28 |
+
# Extract username
|
29 |
+
username_match = re.search(r'Фото профиля\s+(.+?)\n', comment_text)
|
30 |
+
username = username_match.group(1).strip() if username_match else None
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
31 |
|
|
|
|
|
|
|
|
|
|
|
|
|
32 |
if not username:
|
33 |
return None, None, 0, 0
|
34 |
|
35 |
+
# Extract comment text
|
36 |
+
comment_lines = comment_text.split('\n')
|
37 |
comment = ""
|
|
|
|
|
38 |
time_pattern = r'\d+\s*(?:ч\.|нед\.)'
|
39 |
+
|
40 |
+
# Identify where the comment text starts
|
41 |
+
for i, line in enumerate(comment_lines):
|
42 |
if re.search(time_pattern, line):
|
43 |
+
if i + 1 < len(comment_lines):
|
44 |
+
comment = comment_lines[i + 1].strip()
|
45 |
break
|
|
|
|
|
|
|
|
|
|
|
|
|
46 |
|
47 |
+
# Clean up comment text
|
48 |
comment = re.sub(r'\d+\s*(?:ч\.|нед\.)\s*$', '', comment)
|
49 |
comment = re.sub(r'"Нравится":\s*\d+\s*Ответить\s*$', '', comment)
|
50 |
|
51 |
+
# Extract likes
|
52 |
likes_match = re.search(r'"Нравится":\s*(\d+)', comment_text)
|
53 |
likes = int(likes_match.group(1)) if likes_match else 0
|
54 |
|
55 |
+
# Extract time
|
56 |
time_match = re.search(r'(\d+)\s*(?:ч\.|нед\.)', comment_text)
|
57 |
time = int(time_match.group(1)) if time_match else 0
|
58 |
|
|
|
113 |
|
114 |
analytics = f"""
|
115 |
📊 Подробный анализ комментариев:
|
|
|
116 |
Основные метрики:
|
117 |
• Всего комментариев: {total_comments}
|
118 |
• Уникальных пользователей: {unique_users}
|
119 |
• Общее количество лайков: {total_likes}
|
120 |
• Среднее количество лайков: {avg_likes:.1f}
|
|
|
121 |
Дополнительная информация:
|
122 |
• Использовано эмодзи: {total_emojis}
|
123 |
• Количество упоминаний: {len(mentions)}
|
124 |
• Выявлено спам-комментариев: {spam_count}
|
|
|
125 |
Топ комментаторы:
|
126 |
{chr(10).join(f'• {user}: {count} комментария' for user, count in top_commenters if count > 1)}
|
127 |
"""
|
|
|
187 |
description="Анализатор комментариев Instagram с расширенной аналитикой",
|
188 |
theme="default"
|
189 |
)
|
190 |
+
|
191 |
if __name__ == "__main__":
|
192 |
try:
|
193 |
iface.launch(
|