Spaces:

fruitpicker01
/

Test_Pipeline_v10

Sleeping

App Files Files Community

fruitpicker01 commited on Dec 24, 2024

Commit

86f0a05

verified ·

1 Parent(s): 3da7a9c

Update app.py

Browse files

Files changed (1) hide show

app.py +510 -2

app.py CHANGED Viewed

@@ -9,6 +9,7 @@ import json
 import base64
 import time
 from openai import OpenAI
 XAI_API_KEY = os.getenv("XAI_API_KEY")
 client = OpenAI(
@@ -487,9 +488,20 @@ def generate_personalized_sms_wrapper(selected_product, description, product_nam
     print("Final Prompt 2:", final_prompt_2)
     sms_1 = generate_message_with_retry(final_prompt_1, product_name)
     sms_2 = generate_message_with_retry(final_prompt_2, product_name)
     personalization_params = [gender, generation, psychotype, business_stage, industry, opf]
     save_user_request_to_github(selected_product, description, product_name, benefits, key_message, chosen_approach, personalization_params)
-    return sms_1, sms_2, final_prompt_1, final_prompt_2
 def on_regenerate(
     selected_product, description, product_name, benefits, key_message,
@@ -516,6 +528,15 @@ def on_regenerate(
     sms_1 = generate_message_with_retry(final_prompt_1, product_name)
     sms_2 = generate_message_with_retry(final_prompt_2, product_name)
     # Теперь сохраняем всё, как при «Я предпочитаю это SMS»,
     # только chosen_sms="none"
     save_preferred_sms_to_github(
@@ -527,7 +548,7 @@ def on_regenerate(
         chosen_sms="none"  # <-- признак, что ни одно SMS не выбрано
     )
-    return sms_1, sms_2
 def on_load_previous():
     loaded_data = load_previous_user_request_from_github()
@@ -800,7 +821,490 @@ def reset_button_text():
 def reset_button_text_2():
     time.sleep(2)
     return gr.update(value="Я предпочитаю это SMS", visible=True)
 with gr.Blocks(theme="default") as demo:
     gr.Markdown("**Процент созданных SMS по выбранному продукту**")
     progress_bar_html = """
@@ -894,6 +1398,10 @@ with gr.Blocks(theme="default") as demo:
         save_sms_1_btn = gr.Button("Сохранить в базу")
         save_sms_2_btn = gr.Button("Сохранить в базу")
     final_prompt_1_state = gr.State("")
     final_prompt_2_state = gr.State("")

 import base64
 import time
 from openai import OpenAI
+import string
 XAI_API_KEY = os.getenv("XAI_API_KEY")
 client = OpenAI(
     print("Final Prompt 2:", final_prompt_2)
     sms_1 = generate_message_with_retry(final_prompt_1, product_name)
     sms_2 = generate_message_with_retry(final_prompt_2, product_name)
+    # Выполняем проверки sms_1
+    cut_sms_1 = cut_message(sms_1)
+    checks_1 = perform_checks(cut_sms_1, key_message)
+    checks_formatted_1 = format_checks(checks_1)
+    # Выполняем проверки sms_2
+    cut_sms_2 = cut_message(sms_2)
+    checks_2 = perform_checks(cut_sms_2, key_message)
+    checks_formatted_2 = format_checks(checks_2)
     personalization_params = [gender, generation, psychotype, business_stage, industry, opf]
     save_user_request_to_github(selected_product, description, product_name, benefits, key_message, chosen_approach, personalization_params)
+    return sms_1, sms_2, final_prompt_1, final_prompt_2, checks_formatted_1, checks_formatted_2
 def on_regenerate(
     selected_product, description, product_name, benefits, key_message,
     sms_1 = generate_message_with_retry(final_prompt_1, product_name)
     sms_2 = generate_message_with_retry(final_prompt_2, product_name)
+    # Проверяем заново:
+    cut_sms_1 = cut_message(nsms_1)
+    checks_1 = perform_checks(cut_sms_1, key_message)
+    checks_formatted_1 = format_checks(checks_1)
+    cut_sms_2 = cut_message(sms_2)
+    checks_2 = perform_checks(cut_sms_2, key_message)
+    checks_formatted_2 = format_checks(checks_2)
     # Теперь сохраняем всё, как при «Я предпочитаю это SMS»,
     # только chosen_sms="none"
     save_preferred_sms_to_github(
         chosen_sms="none"  # <-- признак, что ни одно SMS не выбрано
     )
+    return sms_1, sms_2, checks_formatted_1, checks_formatted_2
 def on_load_previous():
     loaded_data = load_previous_user_request_from_github()
 def reset_button_text_2():
     time.sleep(2)
     return gr.update(value="Я предпочитаю это SMS", visible=True)
+# ФУНКЦИИ ПРОВЕРОК (НАЧАЛО)
+# 1. Запрещенные слова
+def check_forbidden_words(message):
+    morph = pymorphy3.MorphAnalyzer()
+    # Перечень запрещённых слов и фраз
+    forbidden_patterns = [
+        r'№\s?1\b', r'номер\sодин\b', r'номер\s1\b',
+        r'вкусный', r'дешёвый', r'продукт',
+        r'спам', r'банкротство', r'долг[и]?', r'займ',
+        r'срочный', r'главный',
+        r'гарантия', r'успех', r'лидер', 'никакой'
+    ]
+    # Удаляем знаки препинания для корректного анализа
+    message_without_punctuation = message.translate(str.maketrans('', '', string.punctuation))
+    # Замена всех слов, содержащих "бессроч", на временное значение
+    placeholder = "заменабессроч"
+    message_without_punctuation = re.sub(r'\b\w*бессроч\w*\b', placeholder, message_without_punctuation,
+                                         flags=re.IGNORECASE)
+    # Проверка на наличие подстроки "лучш" (без учета регистра)
+    if re.search(r'лучш', message_without_punctuation, re.IGNORECASE):
+        return (False, 'Есть слово "лучший"')
+    # Лемматизация слов сообщения
+    words = message_without_punctuation.split()
+    lemmas = [morph.parse(word)[0].normal_form for word in words]
+    # Восстановление всех слов с подстрокой "бессроч"
+    lemmas = [re.sub(r'заменабессроч', 'бессроч', word) for word in lemmas]
+    normalized_message = ' '.join(lemmas)
+    # Проверка на запрещённые фразы и леммы
+    for pattern in forbidden_patterns:
+        if re.search(pattern, normalized_message, re.IGNORECASE):
+            print(f"Не пройдена проверка: Запрещенные слова. Сообщение: {message}")
+            return (False, f'Запрещенное слово: {pattern}')
+    return True
+# 2 и #3. Обращение к клиенту и приветствие клиента
+def check_no_greeting(message):
+    morph = pymorphy3.MorphAnalyzer()
+    # Список типичных обращений и приветствий
+    greeting_patterns = [
+        r"привет\b", r"здравствуй", r"добрый\s(день|вечер|утро)",
+        r"дорогой\b", r"уважаемый\b", r"дорогая\b", r"уважаемая\b",
+        r"господин\b", r"госпожа\b", r"друг\b", r"коллега\b",
+        r"товарищ\b", r"приятель\b", r"друг\b", r"подруга\b"
+    ]
+    # Компилируем все шаблоны в один регулярное выражение
+    greeting_regex = re.compile('|'.join(greeting_patterns), re.IGNORECASE)
+    # Проверяем, начинается ли сообщение с шаблона приветствия или обращения
+    if greeting_regex.search(message.strip()):
+        print(f"Не пройдена проверка: Обращение к клиенту и приветствие клиента. Сообщение: {message}")
+        return (False, 'Есть приветствие')
+    return True
+# 4. Обещания и гарантии
+def check_no_promises(message):
+    morph = pymorphy3.MorphAnalyzer()
+    promise_patterns = [
+        "обещать", "обещание", "гарантировать", "обязаться", "обязать", "обязательство", "обязательный"
+    ]
+    words = message.split()
+    lemmas = [morph.parse(word)[0].normal_form for word in words]
+    for pattern in promise_patterns:
+        if pattern in lemmas:
+            print(f"Не пройдена проверка: Обещания и гарантии. Сообщение: {message}")
+            return False, f'Не пройдена проверка: Обещания и гарантии:{pattern}'
+    return True
+# 5. Составные конструкции из двух глаголов
+def check_no_double_verbs(message):
+    morph = pymorphy3.MorphAnalyzer()
+    # Разделяем текст по пробелам и знакам препинания
+    words = re.split(r'\s+|[.!?]', message)
+    morphs = [morph.parse(word)[0] for word in words]
+    for i in range(len(morphs) - 1):
+        # Проверяем, что оба слова являются глаголами (в любой форме, включая инфинитивы)
+        if (morphs[i].tag.POS in {'VERB', 'INFN'}) and (morphs[i + 1].tag.POS in {'VERB', 'INFN'}):
+            # Проверяем, является ли первый глагол "хотеть" или "начинать"
+            if morphs[i].normal_form in ['хотеть', 'начинать', 'начать']:
+                return True
+            else:
+                print(f"Не пройдена проверка: Составные конструкции из двух глаголов. Сообщение: {message}")
+                return False, f'Не пройдена проверка на составные конструкции из двух глаголов: {morphs[i].word} {morphs[i + 1].word}'
+    return True
+# 6. Причастия и причастные обороты
+def check_no_participles(message):
+    morph = pymorphy3.MorphAnalyzer()
+    words = message.split()
+    exceptions = {"повысить", "увеличить", "понизить", "снизить"}
+    for word in words:
+        parsed_word = morph.parse(word)[0]
+        lemma = parsed_word.normal_form
+        if 'PRTF' in parsed_word.tag and lemma not in exceptions:
+            print(f"Не пройдена проверка: Причастия и причастные обороты. Сообщение: {message}")
+            return False, f'Не пройдена проверка на причастия: {parsed_word.word}'
+    return True
+# 7. Деепричастия и деепричастные обороты
+def check_no_adverbial_participles(message):
+    morph = pymorphy3.MorphAnalyzer()
+    words = message.split()
+    morphs = [morph.parse(word)[0] for word in words]
+    for morph in morphs:
+        if 'GRND' in morph.tag:
+            print(f"Не пройдена проверка: Деепричастия и деепричастные обороты. Сообщение: {message}")
+            return False, f'Не пройдена проверка на деепричастия: {morph.word}'
+    return True
+# 8. Превосходная степень прилагательных
+def check_no_superlative_adjectives(message):
+    morph = pymorphy3.MorphAnalyzer()
+    words = message.split()
+    morphs = [morph.parse(word)[0] for word in words]
+    for morph in morphs:
+        if 'Supr' in morph.tag:
+            print(f"Не пройдена проверка: Превосходная степень прилагательных. Сообщение: {message}")
+            return False, f'Не пройдена проверка на превосходную степерь прилагательного: {morph.word}'
+    return True
+# 9. Страдательный залог
+def check_no_passive_voice(message):
+    morph = pymorphy3.MorphAnalyzer()
+    # Разбиваем сообщен��е на слова, игнорируя пунктуацию
+    words = re.findall(r'\b\w+(?:-\w+)*\b', message.lower())
+    for word in words:
+        parse = morph.parse(word)[0]  # Берём только первый разбор
+        if 'pssv' in parse.tag:
+            return False, f'Не пройдена проверка на страдательный залог: {word}'
+    return True
+# 10. Порядковые числительные от 10 прописью
+def check_no_written_out_ordinals(message):
+    morph = pymorphy3.MorphAnalyzer()
+    ordinal_words = [
+        "десятый", "одиннадцатый", "двенадцатый", "тринадцатый", "четырнадцатый", "пятнадцатый",
+        "шестнадцатый", "семнадцатый", "восемнадцатый", "девятнадцатый", "двадцатый"
+    ]
+    words = message.split()
+    lemmas = [morph.parse(word)[0].normal_form for word in words]
+    for word in ordinal_words:
+        if word in lemmas:
+            print(f"Не пройдена проверка: Порядковые числительные от 10 прописью. Сообщение: {message}")
+            return False, f'Не пройдена проверка на порядковые числительные: {word}'
+    return True
+# 11. Цепочки с придаточными предложениями
+def check_no_subordinate_clauses_chain(message):
+    # Регулярное выражение, которое ищет последовательности придаточных предложений
+    subordinate_clause_patterns = [
+        r'\b(который|которая|которое|которые)\b',
+        r'\b(если|потому что|так как|что|когда)\b',
+        r'\b(хотя|несмотря на то что)\b'
+    ]
+    # Разделяем сообщение на предложения по точке, вопросительному и восклицательному знакам
+    sentences = re.split(r'[.!?]\s*', message)
+    count = 0
+    for sentence in sentences:
+        for pattern in subordinate_clause_patterns:
+            if re.search(pattern, sentence):
+                count += 1
+    # Если в предложении найдено более одного придаточного предложения подряд, возвращаем False
+    if count < 2:
+        return True
+    else:
+        return False, f'Не пройдена проверка на цепочки с придаточными предложениями. Предложений: {count}'
+# 12. Разделительные повторяющиеся союзы
+def check_no_repeating_conjunctions(message):
+    # Регулярное выражение для поиска разделительных повторяющихся союзов с запятой перед вторым союзом
+    repeating_conjunctions_patterns = r'\b(и|ни|то|не то|или|либо)\b\s*(.*?)\s*,\s*\b\1\b'
+    # Разделяем сообщение на предложения по точке, вопросительному и восклицательному знакам
+    sentences = re.split(r'[.!?]\s*', message)
+    # Проверяем каждое предложение отдельно
+    for sentence in sentences:
+        if re.search(repeating_conjunctions_patterns, sentence, re.IGNORECASE):
+            print(f"Не пройдена проверка: Разделительные повторяющиеся союзы. Сообщение: {message}")
+            return False, f'Не пройдена проверка на разделительные повторяющиеся союзы: {sentence}'
+    return True
+# 13. Вводные конструкции
+def check_no_introductory_phrases(message):
+    introductory_phrases = [
+        r'\b(во-первых|во-вторых|с одной стороны|по сути|по правде говоря)\b',
+        r'\b(может быть|кстати|конечно|естественно|безусловно|возможно)\b'
+    ]
+    for pattern in introductory_phrases:
+        if re.search(pattern, message, re.IGNORECASE):
+            print(f"Не пройдена проверка: Вводные конструкции. Сообщение: {message}")
+            return False, f'Не пройдена проверка на вводные конструкции: {pattern}'
+    return True
+# 14. Усилители
+def check_no_amplifiers(message):
+    amplifiers = [
+        r'\b(очень|крайне|чрезвычайно|совсем|полностью|чисто)\b'
+    ]
+    for pattern in amplifiers:
+        if re.search(pattern, message, re.IGNORECASE):
+            print(f"Не пройдена проверка: Усилители. Сообщение: {message}")
+            return False, f"Не пройдена пр��верка на усилители: {pattern}"
+    return True
+# 15. Паразиты времени
+def check_no_time_parasites(message):
+    time_parasites = [
+        r'\b(немедленно|срочно|в данный момент)\b'
+    ]
+    for pattern in time_parasites:
+        if re.search(pattern, message, re.IGNORECASE):
+            print(f"Не пройдена проверка: Паразиты времени. Сообщение: {message}")
+            return False, f'Не пройдена проверка на паразитов времени: {pattern}'
+    return True
+# 16. Несколько существительных подряд
+def check_no_multiple_nouns(message):
+    noun_count = 0
+    words = re.split(r'\s+|[.!?]', message)  # Разбиваем по пробелам и знакам препинания
+    morph = pymorphy3.MorphAnalyzer()
+    for word in range(len(words)):
+        parsed_word = morph.parse(words[word])[0]
+        # Если слово — существительное
+        if 'NOUN' in parsed_word.tag:
+            noun_count += 1
+        # Если встречен конец предложения (точка, вопросительный знак, восклицательный знак)
+        elif re.match(r'[.!?]', words[word]):
+            noun_count = 0
+        else:
+            noun_count = 0
+        if noun_count > 2:
+            print(f"Не пройдена проверка: Несколько существительных подряд. Сообщение: {message}")
+            return False, f'Не пройдена проверка на несколько существительных подряд: {words[word - 2: word + 1]}'
+    return True
+# 17. Производные предлоги
+def check_no_derived_prepositions(message):
+    derived_prepositions = [
+        r'\b(в течение|в ходе|вследствие|в связи с|по мере|при помощи|согласно|вопреки|на основании|на случай|в продолжение|по причине|вблизи|вдалеке|вокруг|внутри|вдоль|посередине|вне|снаружи|благодаря|невзирая на|исходя из|благодаря)\b'
+    ]
+    for pattern in derived_prepositions:
+        if re.search(pattern, message, re.IGNORECASE):
+            print(f"Не пройдена проверка: Производные предлоги. Сообщение: {message}")
+            return False, f"Не пройдена проверка на производные предлоги: {pattern}"
+    return True
+# 19. Сложноподчиненные предложения
+def check_no_compound_sentences(message):
+    subordinating_conjunctions = [
+        r'\bкогда\b', r'\bкак только\b', r'\bпока\b', r'\bпосле того как\b',
+        r'\bпотому что\b', r'\bтак как\b', r'\bоттого что\b', r'\bблагодаря тому что\b',
+        r'\bчтобы\b', r'\bдля того чтобы\b', r'\bесли\b', r'\bкогда бы\b', r'\bесли бы\b',
+        r'\bхотя\b', r'\bнесмотря на то что\b', r'\bкак\b', r'\bбудто\b', r'\bсловно\b', r'\bкак будто\b'
+    ]
+    # Убедимся, что слово "как" используется не в вопросе
+    for pattern in subordinating_conjunctions:
+        if re.search(pattern, message) and not re.search(r'\?', message):
+            print(f"Не пройдена проверка: Сложноподчиненные предложения. Сообщение: {message}")
+            return False, f"Не пройдена проверка: Сложноподчиненные предложения: {pattern}"
+    return True
+# 20. Даты прописью
+def check_no_dates_written_out(message):
+    # Ищем упоминания месяцев или слов, связанных с датами
+    months = [
+        "января", "февраля", "марта", "апреля", "мая", "июня",
+        "июля", "августа", "сентября", "октября", "ноября", "декабря"
+    ]
+    # Слова для проверки чисел прописью
+    date_written_out_patterns = [
+        r'\b(первого|второго|третьего|четвертого|пятого|шестого|седьмого|восьмого|девятого|десятого|одиннадцатого|двенадцатого|тринадцатого|четырнадцатого|пятнадцатого|шестнадцатого|семнадцатого|восемнадцатого|девятнадцатого|двадцатого|двадцать первого|двадцать второго|двадцать третьего|двадцать четвертого|двадцать пятого|двадцать шестого|двадцать седьмого|двадцать восьмого|двадцать девятого|тридцатого|тридцать первого)\b'
+    ]
+    for month in months:
+        for pattern in date_written_out_patterns:
+            if re.search(f'{pattern}\\s{month}', message, re.IGNORECASE):
+                print(f"Не пройдена проверка: Даты прописью. Сообщение: {message}")
+                return False, f"Не пройдена проверка на даты прописью: {pattern}"
+    return True
+# Доп правило. Повторы слов
+def check_no_word_repetitions(message, key_message):
+    morph = pymorphy3.MorphAnalyzer()
+    # Определяем набор частей речи, которые будем игнорировать
+    ignore_pos = {
+        'PREP',  # Предлоги
+        'CONJ',  # Союзы
+        'PRON',  # Местоимения
+        'INTJ',  # Междометия
+        'NUMR',  # Числительные
+        'PART',  # Частицы
+        'NPRO'
+    }
+    # Разбиваем текст на слова, учитывая составные слова с дефисом
+    words = re.findall(r'\b\w+(?:-\w+)*\b', message.lower())
+    # Функция для нормализации слов и получения их базовых форм
+    def normalize_word(word):
+        parses = morph.parse(word)
+        if not parses:
+            return word  # Если слово не распознано, возвращаем как есть
+        parse = parses[0]
+        return parse.normal_form, parse.tag.POS
+    # Нормализуем ключевое сообщение и собираем его базовые формы
+    key_normalized = set()
+    for word in re.findall(r'\b\w+\b', key_message.lower()):
+        norm, pos = normalize_word(word)
+        key_normalized.add(norm)
+    # Добавляем базовые формы ключевого сообщения в игнорируемые слова
+    # Это позволяет игнорировать повторения слов из ключевого сообщения
+    # Кроме того, игнорируем слова из определенных частей речи
+    normalized_words = {}
+    for word in words:
+        norm, pos = normalize_word(word)
+        # Игнорируем слово, если оно относится к одной из игнорируемых частей речи
+        if pos in ignore_pos:
+            continue
+        # Игнорируем слово, если оно присутствует в ключевом сообщении
+        if norm in key_normalized:
+            continue
+        # Если слово уже встречалось, возвращаем False
+        if norm in normalized_words:
+            print(f"Не пройдена проверка: Повторы слов. Сообщение: {message}")
+            return False, f"Не пройдена проверка на повторы слов: {norm}"
+        # Добавляем слово в словарь для отслеживания повторов
+        normalized_words[norm] = True
+    # Если повторов не найдено, возвращаем True
+    return True
+# ФУНКЦИИ ПРОВЕРОК (КОНЕЦ)
+def cut_message(message: str):
+    if '------' in message:
+        message = message.split('------')[0].strip()
+    return message
+def safe_check(func, message, key_message=None):
+    try:
+        # Если функция ожидает 2 аргумента (например, check_no_word_repetitions),
+        # передаём key_message:
+        import inspect
+        sig = inspect.signature(func)
+        if len(sig.parameters) == 2:
+            return asyncio.run(func(message, key_message))
+        else:
+            return asyncio.run(func(message))
+    except Exception as e:
+        return None
+def perform_checks(message, key_message):
+    checks = {
+        "forbidden_words": safe_check(check_forbidden_words, message),
+        "client_addressing": safe_check(check_no_greeting, message),
+        "promises": safe_check(check_no_promises, message),
+        "double_verbs": safe_check(check_no_double_verbs, message),
+        "participles": safe_check(check_no_participles, message),
+        "adverbial_participles": safe_check(check_no_adverbial_participles, message),
+        "superlative_adjectives": safe_check(check_no_superlative_adjectives, message),
+        "passive_voice": safe_check(check_no_passive_voice, message),
+        "written_out_ordinals": safe_check(check_no_written_out_ordinals, message),
+        "subordinate_clauses_chain": safe_check(check_no_subordinate_clauses_chain, message),
+        "repeating_conjunctions": safe_check(check_no_repeating_conjunctions, message),
+        "introductory_phrases": safe_check(check_no_introductory_phrases, message),
+        "amplifiers": safe_check(check_no_amplifiers, message),
+        "time_parasites": safe_check(check_no_time_parasites, message),
+        "multiple_nouns": safe_check(check_no_multiple_nouns, message),
+        "derived_prepositions": safe_check(check_no_derived_prepositions, message),
+        "compound_sentences": safe_check(check_no_compound_sentences, message),
+        "dates_written_out": safe_check(check_no_dates_written_out, message),
+        "no_word_repetitions": safe_check(check_no_word_repetitions, message, key_message),
+    }
+    return checks
+def format_checks(checks):
+    translation = {
+        "forbidden_words": "Запрещенные слова",
+        "client_addressing": "Обращение к клиенту",
+        "promises": "Обещания и гарантии",
+        "double_verbs": "Два глагола подряд",
+        "participles": "Причастия",
+        "adverbial_participles": "Деепричастия",
+        "superlative_adjectives": "Превосходная степень",
+        "passive_voice": "Страдательный залог",
+        "written_out_ordinals": "Порядковые числительные",
+        "subordinate_clauses_chain": "Цепочки придаточных",
+        "repeating_conjunctions": "Повторяющиеся союзы",
+        "introductory_phrases": "Вводные конструкции",
+        "amplifiers": "Усилители",
+        "time_parasites": "Паразиты времени",
+        "multiple_nouns": "Сущ. подряд",
+        "derived_prepositions": "Производные предлоги",
+        "compound_sentences": "Сложноподчиненные предложения",
+        "dates_written_out": "Даты прописью",
+        "no_word_repetitions": "Повторы слов"
+    }
+    formatted_results = []
+    for rule, result in checks.items():
+        if result is True:
+            symbol = '✔️'
+        elif result is False:
+            symbol = '❌'
+        else:
+            symbol = '❓'
+        formatted_results.append(f"{translation[rule]}: {symbol}")
+    return "\n".join(formatted_results)
 with gr.Blocks(theme="default") as demo:
     gr.Markdown("**Процент созданных SMS по выбранному продукту**")
     progress_bar_html = """
         save_sms_1_btn = gr.Button("Сохранить в базу")
         save_sms_2_btn = gr.Button("Сохранить в базу")
+    with gr.Row():
+        checks_sms_1 = gr.Markdown()
+        checks_sms_2 = gr.Markdown()
     final_prompt_1_state = gr.State("")
     final_prompt_2_state = gr.State("")