Update app.py
Browse files
app.py
CHANGED
|
@@ -25,54 +25,34 @@ def is_spam(text: str) -> bool:
|
|
| 25 |
def extract_comment_data(comment_text: str) -> Tuple[Optional[str], Optional[str], int, int]:
|
| 26 |
"""Извлекает данные из комментария"""
|
| 27 |
try:
|
| 28 |
-
|
| 29 |
-
|
| 30 |
-
|
| 31 |
-
# Извлекаем имя пользователя (поддержка обоих форматов)
|
| 32 |
-
username = None
|
| 33 |
-
|
| 34 |
-
# Формат 1: "Фото профиля username\nusername\n"
|
| 35 |
-
if "Фото профиля" in comment_text:
|
| 36 |
-
username_match = re.search(r"Фото профиля ([^\n]+)", comment_text)
|
| 37 |
-
if username_match:
|
| 38 |
-
username = username_match.group(1).strip()
|
| 39 |
|
| 40 |
-
# Формат 2: Прямое указание имени пользователя
|
| 41 |
-
else:
|
| 42 |
-
lines = comment_text.split('\n')
|
| 43 |
-
if lines and lines[0].strip():
|
| 44 |
-
username = lines[0].strip()
|
| 45 |
-
|
| 46 |
if not username:
|
| 47 |
return None, None, 0, 0
|
| 48 |
|
| 49 |
-
#
|
| 50 |
-
|
| 51 |
comment = ""
|
| 52 |
-
|
| 53 |
-
# Ищем комментарий после времени
|
| 54 |
time_pattern = r'\d+\s*(?:ч\.|нед\.)'
|
| 55 |
-
|
|
|
|
|
|
|
| 56 |
if re.search(time_pattern, line):
|
| 57 |
-
if i + 1 < len(
|
| 58 |
-
comment =
|
| 59 |
break
|
| 60 |
-
elif username in line and i + 2 < len(lines):
|
| 61 |
-
# Проверяем следующую строку после юзернейма
|
| 62 |
-
next_line = lines[i + 1].strip()
|
| 63 |
-
if not re.search(time_pattern, next_line):
|
| 64 |
-
comment = next_line
|
| 65 |
-
break
|
| 66 |
|
| 67 |
-
#
|
| 68 |
comment = re.sub(r'\d+\s*(?:ч\.|нед\.)\s*$', '', comment)
|
| 69 |
comment = re.sub(r'"Нравится":\s*\d+\s*Ответить\s*$', '', comment)
|
| 70 |
|
| 71 |
-
#
|
| 72 |
likes_match = re.search(r'"Нравится":\s*(\d+)', comment_text)
|
| 73 |
likes = int(likes_match.group(1)) if likes_match else 0
|
| 74 |
|
| 75 |
-
#
|
| 76 |
time_match = re.search(r'(\d+)\s*(?:ч\.|нед\.)', comment_text)
|
| 77 |
time = int(time_match.group(1)) if time_match else 0
|
| 78 |
|
|
@@ -133,18 +113,15 @@ def analyze_post(content_type: str, link: str, post_likes: int,
|
|
| 133 |
|
| 134 |
analytics = f"""
|
| 135 |
📊 Подробный анализ комментариев:
|
| 136 |
-
|
| 137 |
Основные метрики:
|
| 138 |
• Всего комментариев: {total_comments}
|
| 139 |
• Уникальных пользователей: {unique_users}
|
| 140 |
• Общее количество лайков: {total_likes}
|
| 141 |
• Среднее количество лайков: {avg_likes:.1f}
|
| 142 |
-
|
| 143 |
Дополнительная информация:
|
| 144 |
• Использовано эмодзи: {total_emojis}
|
| 145 |
• Количество упоминаний: {len(mentions)}
|
| 146 |
• Выявлено спам-комментариев: {spam_count}
|
| 147 |
-
|
| 148 |
Топ комментаторы:
|
| 149 |
{chr(10).join(f'• {user}: {count} комментария' for user, count in top_commenters if count > 1)}
|
| 150 |
"""
|
|
@@ -210,6 +187,7 @@ iface = gr.Interface(
|
|
| 210 |
description="Анализатор комментариев Instagram с расширенной аналитикой",
|
| 211 |
theme="default"
|
| 212 |
)
|
|
|
|
| 213 |
if __name__ == "__main__":
|
| 214 |
try:
|
| 215 |
iface.launch(
|
|
|
|
| 25 |
def extract_comment_data(comment_text: str) -> Tuple[Optional[str], Optional[str], int, int]:
|
| 26 |
"""Извлекает данные из комментария"""
|
| 27 |
try:
|
| 28 |
+
# Extract username
|
| 29 |
+
username_match = re.search(r'Фото профиля\s+(.+?)\n', comment_text)
|
| 30 |
+
username = username_match.group(1).strip() if username_match else None
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 31 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 32 |
if not username:
|
| 33 |
return None, None, 0, 0
|
| 34 |
|
| 35 |
+
# Extract comment text
|
| 36 |
+
comment_lines = comment_text.split('\n')
|
| 37 |
comment = ""
|
|
|
|
|
|
|
| 38 |
time_pattern = r'\d+\s*(?:ч\.|нед\.)'
|
| 39 |
+
|
| 40 |
+
# Identify where the comment text starts
|
| 41 |
+
for i, line in enumerate(comment_lines):
|
| 42 |
if re.search(time_pattern, line):
|
| 43 |
+
if i + 1 < len(comment_lines):
|
| 44 |
+
comment = comment_lines[i + 1].strip()
|
| 45 |
break
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 46 |
|
| 47 |
+
# Clean up comment text
|
| 48 |
comment = re.sub(r'\d+\s*(?:ч\.|нед\.)\s*$', '', comment)
|
| 49 |
comment = re.sub(r'"Нравится":\s*\d+\s*Ответить\s*$', '', comment)
|
| 50 |
|
| 51 |
+
# Extract likes
|
| 52 |
likes_match = re.search(r'"Нравится":\s*(\d+)', comment_text)
|
| 53 |
likes = int(likes_match.group(1)) if likes_match else 0
|
| 54 |
|
| 55 |
+
# Extract time
|
| 56 |
time_match = re.search(r'(\d+)\s*(?:ч\.|нед\.)', comment_text)
|
| 57 |
time = int(time_match.group(1)) if time_match else 0
|
| 58 |
|
|
|
|
| 113 |
|
| 114 |
analytics = f"""
|
| 115 |
📊 Подробный анализ комментариев:
|
|
|
|
| 116 |
Основные метрики:
|
| 117 |
• Всего комментариев: {total_comments}
|
| 118 |
• Уникальных пользователей: {unique_users}
|
| 119 |
• Общее количество лайков: {total_likes}
|
| 120 |
• Среднее количество лайков: {avg_likes:.1f}
|
|
|
|
| 121 |
Дополнительная информация:
|
| 122 |
• Использовано эмодзи: {total_emojis}
|
| 123 |
• Количество упоминаний: {len(mentions)}
|
| 124 |
• Выявлено спам-комментариев: {spam_count}
|
|
|
|
| 125 |
Топ комментаторы:
|
| 126 |
{chr(10).join(f'• {user}: {count} комментария' for user, count in top_commenters if count > 1)}
|
| 127 |
"""
|
|
|
|
| 187 |
description="Анализатор комментариев Instagram с расширенной аналитикой",
|
| 188 |
theme="default"
|
| 189 |
)
|
| 190 |
+
|
| 191 |
if __name__ == "__main__":
|
| 192 |
try:
|
| 193 |
iface.launch(
|