Spaces:

boompack
/

parmuza

Sleeping

App Files Files Community

boompack commited on Nov 7, 2024

Commit

09539e9

verified ·

1 Parent(s): 21910df

Update app.py

Browse files

Files changed (1) hide show

app.py +23 -35

app.py CHANGED Viewed

@@ -1,41 +1,29 @@
-import gradio as gr
 import re
-# Функция для обработки входного текста
-def process_text(input_text):
-    # Печать входных данных для отладки
-    print(f"Входные данные: {input_text}")
-    # Регулярное выражение для извлечения данных
-    pattern = r"([a-zA-Z0-9_@]+)([^\n]*?)(?=\d{1,2}\sнед\.|\d{1,2}\sдн\.|$)"  # Ищем текст до метки времени (нед. или дн.)
-    # Поиск всех совпадений в тексте
-    matches = re.findall(pattern, input_text)
-    # Печать найденных совпадений для отладки
-    print(f"Найденные совпадения: {matches}")
-    # Проверка наличия совпадений
-    if not matches:
-        return "Совпадения не найдены. Пожалуйста, проверьте ввод."
-    # Формируем вывод
-    output = []
-    for i, match in enumerate(matches, 1):
-        username = match[0].strip()
-        text = re.sub(r"Нравится: \d+|Ответить|Показать перевод|Действия с комментарием|Нравится|Скрыть ответы", "", match[1]).strip()  # Удаляем лишние фразы
-        likes = re.search(r"Нравится: (\d+)", match[1])
-        like_count = likes.group(1) if likes else "0"  # Если лайков нет, ставим 0
-        output.append(f'{i}. Пользователь: "{username}", Текст: "{text}", Лайков: {like_count}')
-    return "\n".join(output)
-# Настройка Gradio интерфейса
-iface = gr.Interface(
-    fn=process_text,
-    inputs=gr.Textbox(lines=10, placeholder="Введите текст сюда..."),
-    outputs=gr.Textbox(lines=10, placeholder="Результат...")
-)
-# Запуск интерфейса
-iface.launch()

 import re
+def parse_comments(raw_text):
+    # Разбиваем текст на отдельные комментарии по слову "Ответить"
+    comment_blocks = raw_text.split("Ответить")
+    results = []
+    for block in comment_blocks:
+        # Шаблон для извлечения ника, текста и количества лайков
+        user_match = re.search(r'([\w\d@]+)(.*?)(\d+)?\sнед.', block)
+        text_match = re.search(r'(.*?)(?=Нравится|Показать перевод|Скрыть ответы)', block)
+        likes_match = re.search(r'Нравится:\s*(\d+)', block)
+        if user_match and text_match:
+            user = user_match.group(1)
+            text = text_match.group(1).strip()
+            likes = int(likes_match.group(1)) if likes_match else 0
+            results.append({"Пользователь": user, "Текст": text, "Лайков": likes})
+    return results
+# Входные данные
+raw_text = """alormusicgroupKeep going‼️‼️1 нед.Нравится: 1ОтветитьПоказать переводДействия с комментариемНравитсяСкрыть ответыjfk_4president@alormusicgroup  Big facts 🫡🫡🦾1 нед.ОтветитьПоказать переводДействия с комментариемНравится..."""
+# Вывод
+parsed_comments = parse_comments(raw_text)
+for comment in parsed_comments:
+    print(comment)