Spaces:
Sleeping
Sleeping
Update app.py
Browse files
app.py
CHANGED
@@ -9,6 +9,7 @@ import json
|
|
9 |
import base64
|
10 |
import time
|
11 |
from openai import OpenAI
|
|
|
12 |
|
13 |
XAI_API_KEY = os.getenv("XAI_API_KEY")
|
14 |
client = OpenAI(
|
@@ -487,9 +488,20 @@ def generate_personalized_sms_wrapper(selected_product, description, product_nam
|
|
487 |
print("Final Prompt 2:", final_prompt_2)
|
488 |
sms_1 = generate_message_with_retry(final_prompt_1, product_name)
|
489 |
sms_2 = generate_message_with_retry(final_prompt_2, product_name)
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
490 |
personalization_params = [gender, generation, psychotype, business_stage, industry, opf]
|
491 |
save_user_request_to_github(selected_product, description, product_name, benefits, key_message, chosen_approach, personalization_params)
|
492 |
-
return sms_1, sms_2, final_prompt_1, final_prompt_2
|
493 |
|
494 |
def on_regenerate(
|
495 |
selected_product, description, product_name, benefits, key_message,
|
@@ -516,6 +528,15 @@ def on_regenerate(
|
|
516 |
sms_1 = generate_message_with_retry(final_prompt_1, product_name)
|
517 |
sms_2 = generate_message_with_retry(final_prompt_2, product_name)
|
518 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
519 |
# Теперь сохраняем всё, как при «Я предпочитаю это SMS»,
|
520 |
# только chosen_sms="none"
|
521 |
save_preferred_sms_to_github(
|
@@ -527,7 +548,7 @@ def on_regenerate(
|
|
527 |
chosen_sms="none" # <-- признак, что ни одно SMS не выбрано
|
528 |
)
|
529 |
|
530 |
-
return sms_1, sms_2
|
531 |
|
532 |
def on_load_previous():
|
533 |
loaded_data = load_previous_user_request_from_github()
|
@@ -800,7 +821,490 @@ def reset_button_text():
|
|
800 |
def reset_button_text_2():
|
801 |
time.sleep(2)
|
802 |
return gr.update(value="Я предпочитаю это SMS", visible=True)
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
803 |
|
|
|
804 |
with gr.Blocks(theme="default") as demo:
|
805 |
gr.Markdown("**Процент созданных SMS по выбранному продукту**")
|
806 |
progress_bar_html = """
|
@@ -894,6 +1398,10 @@ with gr.Blocks(theme="default") as demo:
|
|
894 |
save_sms_1_btn = gr.Button("Сохранить в базу")
|
895 |
save_sms_2_btn = gr.Button("Сохранить в базу")
|
896 |
|
|
|
|
|
|
|
|
|
897 |
final_prompt_1_state = gr.State("")
|
898 |
final_prompt_2_state = gr.State("")
|
899 |
|
|
|
9 |
import base64
|
10 |
import time
|
11 |
from openai import OpenAI
|
12 |
+
import string
|
13 |
|
14 |
XAI_API_KEY = os.getenv("XAI_API_KEY")
|
15 |
client = OpenAI(
|
|
|
488 |
print("Final Prompt 2:", final_prompt_2)
|
489 |
sms_1 = generate_message_with_retry(final_prompt_1, product_name)
|
490 |
sms_2 = generate_message_with_retry(final_prompt_2, product_name)
|
491 |
+
|
492 |
+
# Выполняем проверки sms_1
|
493 |
+
cut_sms_1 = cut_message(sms_1)
|
494 |
+
checks_1 = perform_checks(cut_sms_1, key_message)
|
495 |
+
checks_formatted_1 = format_checks(checks_1)
|
496 |
+
|
497 |
+
# Выполняем проверки sms_2
|
498 |
+
cut_sms_2 = cut_message(sms_2)
|
499 |
+
checks_2 = perform_checks(cut_sms_2, key_message)
|
500 |
+
checks_formatted_2 = format_checks(checks_2)
|
501 |
+
|
502 |
personalization_params = [gender, generation, psychotype, business_stage, industry, opf]
|
503 |
save_user_request_to_github(selected_product, description, product_name, benefits, key_message, chosen_approach, personalization_params)
|
504 |
+
return sms_1, sms_2, final_prompt_1, final_prompt_2, checks_formatted_1, checks_formatted_2
|
505 |
|
506 |
def on_regenerate(
|
507 |
selected_product, description, product_name, benefits, key_message,
|
|
|
528 |
sms_1 = generate_message_with_retry(final_prompt_1, product_name)
|
529 |
sms_2 = generate_message_with_retry(final_prompt_2, product_name)
|
530 |
|
531 |
+
# Проверяем заново:
|
532 |
+
cut_sms_1 = cut_message(nsms_1)
|
533 |
+
checks_1 = perform_checks(cut_sms_1, key_message)
|
534 |
+
checks_formatted_1 = format_checks(checks_1)
|
535 |
+
|
536 |
+
cut_sms_2 = cut_message(sms_2)
|
537 |
+
checks_2 = perform_checks(cut_sms_2, key_message)
|
538 |
+
checks_formatted_2 = format_checks(checks_2)
|
539 |
+
|
540 |
# Теперь сохраняем всё, как при «Я предпочитаю это SMS»,
|
541 |
# только chosen_sms="none"
|
542 |
save_preferred_sms_to_github(
|
|
|
548 |
chosen_sms="none" # <-- признак, что ни одно SMS не выбрано
|
549 |
)
|
550 |
|
551 |
+
return sms_1, sms_2, checks_formatted_1, checks_formatted_2
|
552 |
|
553 |
def on_load_previous():
|
554 |
loaded_data = load_previous_user_request_from_github()
|
|
|
821 |
def reset_button_text_2():
|
822 |
time.sleep(2)
|
823 |
return gr.update(value="Я предпочитаю это SMS", visible=True)
|
824 |
+
|
825 |
+
# ФУНКЦИИ ПРОВЕРОК (НАЧАЛО)
|
826 |
+
|
827 |
+
# 1. Запрещенные слова
|
828 |
+
|
829 |
+
def check_forbidden_words(message):
|
830 |
+
morph = pymorphy3.MorphAnalyzer()
|
831 |
+
|
832 |
+
# Перечень запрещённых слов и фраз
|
833 |
+
forbidden_patterns = [
|
834 |
+
r'№\s?1\b', r'номер\sодин\b', r'номер\s1\b',
|
835 |
+
r'вкусный', r'дешёвый', r'продукт',
|
836 |
+
r'спам', r'банкротство', r'долг[и]?', r'займ',
|
837 |
+
r'срочный', r'главный',
|
838 |
+
r'гарантия', r'успех', r'лидер', 'никакой'
|
839 |
+
]
|
840 |
+
|
841 |
+
# Удаляем знаки препинания для корректного анализа
|
842 |
+
message_without_punctuation = message.translate(str.maketrans('', '', string.punctuation))
|
843 |
+
|
844 |
+
# Замена всех слов, содержащих "бессроч", на временное значение
|
845 |
+
placeholder = "заменабессроч"
|
846 |
+
message_without_punctuation = re.sub(r'\b\w*бессроч\w*\b', placeholder, message_without_punctuation,
|
847 |
+
flags=re.IGNORECASE)
|
848 |
+
|
849 |
+
# Проверка на наличие подстроки "лучш" (без учета регистра)
|
850 |
+
if re.search(r'лучш', message_without_punctuation, re.IGNORECASE):
|
851 |
+
return (False, 'Есть слово "лучший"')
|
852 |
+
|
853 |
+
# Лемматизация слов сообщения
|
854 |
+
words = message_without_punctuation.split()
|
855 |
+
lemmas = [morph.parse(word)[0].normal_form for word in words]
|
856 |
+
|
857 |
+
# Восстановление всех слов с подстрокой "бессроч"
|
858 |
+
lemmas = [re.sub(r'заменабессроч', 'бессроч', word) for word in lemmas]
|
859 |
+
normalized_message = ' '.join(lemmas)
|
860 |
+
|
861 |
+
# Проверка на запрещённые фразы и леммы
|
862 |
+
for pattern in forbidden_patterns:
|
863 |
+
if re.search(pattern, normalized_message, re.IGNORECASE):
|
864 |
+
print(f"Не пройдена проверка: Запрещенные слова. Сообщение: {message}")
|
865 |
+
return (False, f'Запрещенное слово: {pattern}')
|
866 |
+
|
867 |
+
return True
|
868 |
+
|
869 |
+
|
870 |
+
# 2 и #3. Обращение к клиенту и приветствие клиента
|
871 |
+
|
872 |
+
def check_no_greeting(message):
|
873 |
+
morph = pymorphy3.MorphAnalyzer()
|
874 |
+
# Список типичных обращений и приветствий
|
875 |
+
greeting_patterns = [
|
876 |
+
r"привет\b", r"здравствуй", r"добрый\s(день|вечер|утро)",
|
877 |
+
r"дорогой\b", r"уважаемый\b", r"дорогая\b", r"уважаемая\b",
|
878 |
+
r"господин\b", r"госпожа\b", r"друг\b", r"коллега\b",
|
879 |
+
r"товарищ\b", r"приятель\b", r"друг\b", r"подруга\b"
|
880 |
+
]
|
881 |
+
|
882 |
+
# Компилируем все шаблоны в один регулярное выражение
|
883 |
+
greeting_regex = re.compile('|'.join(greeting_patterns), re.IGNORECASE)
|
884 |
+
|
885 |
+
# Проверяем, начинается ли сообщение с шаблона приветствия или обращения
|
886 |
+
if greeting_regex.search(message.strip()):
|
887 |
+
print(f"Не пройдена проверка: Обращение к клиенту и приветствие клиента. Сообщение: {message}")
|
888 |
+
return (False, 'Есть приветствие')
|
889 |
+
return True
|
890 |
+
|
891 |
+
|
892 |
+
# 4. Обещания и гарантии
|
893 |
+
|
894 |
+
def check_no_promises(message):
|
895 |
+
morph = pymorphy3.MorphAnalyzer()
|
896 |
+
promise_patterns = [
|
897 |
+
"обещать", "обещание", "гарантировать", "обязаться", "обязать", "обязательство", "обязательный"
|
898 |
+
]
|
899 |
+
|
900 |
+
words = message.split()
|
901 |
+
lemmas = [morph.parse(word)[0].normal_form for word in words]
|
902 |
+
|
903 |
+
for pattern in promise_patterns:
|
904 |
+
if pattern in lemmas:
|
905 |
+
print(f"Не пройдена проверка: Обещания и гарантии. Сообщение: {message}")
|
906 |
+
return False, f'Не пройдена проверка: Обещания и гарантии:{pattern}'
|
907 |
+
return True
|
908 |
+
|
909 |
+
|
910 |
+
# 5. Составные конструкции из двух глаголов
|
911 |
+
|
912 |
+
def check_no_double_verbs(message):
|
913 |
+
morph = pymorphy3.MorphAnalyzer()
|
914 |
+
# Разделяем текст по пробелам и знакам препинания
|
915 |
+
words = re.split(r'\s+|[.!?]', message)
|
916 |
+
morphs = [morph.parse(word)[0] for word in words]
|
917 |
+
|
918 |
+
for i in range(len(morphs) - 1):
|
919 |
+
# Проверяем, что оба слова являются глаголами (в любой форме, включая инфинитивы)
|
920 |
+
if (morphs[i].tag.POS in {'VERB', 'INFN'}) and (morphs[i + 1].tag.POS in {'VERB', 'INFN'}):
|
921 |
+
# Проверяем, является ли первый глагол "хотеть" или "начинать"
|
922 |
+
if morphs[i].normal_form in ['хотеть', 'начинать', 'начать']:
|
923 |
+
return True
|
924 |
+
else:
|
925 |
+
print(f"Не пройдена проверка: Составные конструкции из двух глаголов. Сообщение: {message}")
|
926 |
+
return False, f'Не пройдена проверка на составные конструкции из двух глаголов: {morphs[i].word} {morphs[i + 1].word}'
|
927 |
+
return True
|
928 |
+
|
929 |
+
|
930 |
+
# 6. Причастия и причастные обороты
|
931 |
+
|
932 |
+
def check_no_participles(message):
|
933 |
+
morph = pymorphy3.MorphAnalyzer()
|
934 |
+
words = message.split()
|
935 |
+
exceptions = {"повысить", "увеличить", "понизить", "снизить"}
|
936 |
+
|
937 |
+
for word in words:
|
938 |
+
parsed_word = morph.parse(word)[0]
|
939 |
+
lemma = parsed_word.normal_form
|
940 |
+
if 'PRTF' in parsed_word.tag and lemma not in exceptions:
|
941 |
+
print(f"Не пройдена проверка: Причастия и причастные обороты. Сообщение: {message}")
|
942 |
+
return False, f'Не пройдена проверка на причастия: {parsed_word.word}'
|
943 |
+
return True
|
944 |
+
|
945 |
+
|
946 |
+
# 7. Деепричастия и деепричастные обороты
|
947 |
+
|
948 |
+
def check_no_adverbial_participles(message):
|
949 |
+
morph = pymorphy3.MorphAnalyzer()
|
950 |
+
words = message.split()
|
951 |
+
morphs = [morph.parse(word)[0] for word in words]
|
952 |
+
|
953 |
+
for morph in morphs:
|
954 |
+
if 'GRND' in morph.tag:
|
955 |
+
print(f"Не пройдена проверка: Деепричастия и деепричастные обороты. Сообщение: {message}")
|
956 |
+
return False, f'Не пройдена проверка на деепричастия: {morph.word}'
|
957 |
+
return True
|
958 |
+
|
959 |
+
|
960 |
+
# 8. Превосходная степень прилагательных
|
961 |
+
|
962 |
+
def check_no_superlative_adjectives(message):
|
963 |
+
morph = pymorphy3.MorphAnalyzer()
|
964 |
+
words = message.split()
|
965 |
+
morphs = [morph.parse(word)[0] for word in words]
|
966 |
+
|
967 |
+
for morph in morphs:
|
968 |
+
if 'Supr' in morph.tag:
|
969 |
+
print(f"Не пройдена проверка: Превосходная степень прилагательных. Сообщение: {message}")
|
970 |
+
return False, f'Не пройдена проверка на превосходную степерь прилагательного: {morph.word}'
|
971 |
+
return True
|
972 |
+
|
973 |
+
|
974 |
+
# 9. Страдательный залог
|
975 |
+
|
976 |
+
def check_no_passive_voice(message):
|
977 |
+
morph = pymorphy3.MorphAnalyzer()
|
978 |
+
# Разбиваем сообщен��е на слова, игнорируя пунктуацию
|
979 |
+
words = re.findall(r'\b\w+(?:-\w+)*\b', message.lower())
|
980 |
+
|
981 |
+
for word in words:
|
982 |
+
parse = morph.parse(word)[0] # Берём только первый разбор
|
983 |
+
if 'pssv' in parse.tag:
|
984 |
+
return False, f'Не пройдена проверка на страдательный залог: {word}'
|
985 |
+
return True
|
986 |
+
|
987 |
+
|
988 |
+
# 10. Порядковые числительные от 10 прописью
|
989 |
+
|
990 |
+
def check_no_written_out_ordinals(message):
|
991 |
+
morph = pymorphy3.MorphAnalyzer()
|
992 |
+
ordinal_words = [
|
993 |
+
"десятый", "одиннадцатый", "двенадцатый", "тринадцатый", "четырнадцатый", "пятнадцатый",
|
994 |
+
"шестнадцатый", "семнадцатый", "восемнадцатый", "девятнадцатый", "двадцатый"
|
995 |
+
]
|
996 |
+
|
997 |
+
words = message.split()
|
998 |
+
lemmas = [morph.parse(word)[0].normal_form for word in words]
|
999 |
+
|
1000 |
+
for word in ordinal_words:
|
1001 |
+
if word in lemmas:
|
1002 |
+
print(f"Не пройдена проверка: Порядковые числительные от 10 прописью. Сообщение: {message}")
|
1003 |
+
return False, f'Не пройдена проверка на порядковые числительные: {word}'
|
1004 |
+
return True
|
1005 |
+
|
1006 |
+
|
1007 |
+
# 11. Цепочки с придаточными предложениями
|
1008 |
+
|
1009 |
+
def check_no_subordinate_clauses_chain(message):
|
1010 |
+
# Регулярное выражение, которое ищет последовательности придаточных предложений
|
1011 |
+
subordinate_clause_patterns = [
|
1012 |
+
r'\b(который|которая|которое|которые)\b',
|
1013 |
+
r'\b(если|потому что|так как|что|когда)\b',
|
1014 |
+
r'\b(хотя|несмотря на то что)\b'
|
1015 |
+
]
|
1016 |
+
# Разделяем сообщение на предложения по точке, вопросительному и восклицательному знакам
|
1017 |
+
sentences = re.split(r'[.!?]\s*', message)
|
1018 |
+
|
1019 |
+
count = 0
|
1020 |
+
for sentence in sentences:
|
1021 |
+
for pattern in subordinate_clause_patterns:
|
1022 |
+
if re.search(pattern, sentence):
|
1023 |
+
count += 1
|
1024 |
+
|
1025 |
+
# Если в предложении найдено более одного придаточного предложения подряд, возвращаем False
|
1026 |
+
if count < 2:
|
1027 |
+
return True
|
1028 |
+
else:
|
1029 |
+
return False, f'Не пройдена проверка на цепочки с придаточными предложениями. Предложений: {count}'
|
1030 |
+
|
1031 |
+
|
1032 |
+
# 12. Разделительные повторяющиеся союзы
|
1033 |
+
|
1034 |
+
def check_no_repeating_conjunctions(message):
|
1035 |
+
# Регулярное выражение для поиска разделительных повторяющихся союзов с запятой перед вторым союзом
|
1036 |
+
repeating_conjunctions_patterns = r'\b(и|ни|то|не то|или|либо)\b\s*(.*?)\s*,\s*\b\1\b'
|
1037 |
+
|
1038 |
+
# Разделяем сообщение на предложения по точке, вопросительному и восклицательному знакам
|
1039 |
+
sentences = re.split(r'[.!?]\s*', message)
|
1040 |
+
|
1041 |
+
# Проверяем каждое предложение отдельно
|
1042 |
+
for sentence in sentences:
|
1043 |
+
if re.search(repeating_conjunctions_patterns, sentence, re.IGNORECASE):
|
1044 |
+
print(f"Не пройдена проверка: Разделительные повторяющиеся союзы. Сообщение: {message}")
|
1045 |
+
return False, f'Не пройдена проверка на разделительные повторяющиеся союзы: {sentence}'
|
1046 |
+
return True
|
1047 |
+
|
1048 |
+
|
1049 |
+
# 13. Вводные конструкции
|
1050 |
+
|
1051 |
+
def check_no_introductory_phrases(message):
|
1052 |
+
introductory_phrases = [
|
1053 |
+
r'\b(во-первых|во-вторых|с одной стороны|по сути|по правде говоря)\b',
|
1054 |
+
r'\b(может быть|кстати|конечно|естественно|безусловно|возможно)\b'
|
1055 |
+
]
|
1056 |
+
|
1057 |
+
for pattern in introductory_phrases:
|
1058 |
+
if re.search(pattern, message, re.IGNORECASE):
|
1059 |
+
print(f"Не пройдена проверка: Вводные конструкции. Сообщение: {message}")
|
1060 |
+
return False, f'Не пройдена проверка на вводные конструкции: {pattern}'
|
1061 |
+
return True
|
1062 |
+
|
1063 |
+
|
1064 |
+
# 14. Усилители
|
1065 |
+
|
1066 |
+
def check_no_amplifiers(message):
|
1067 |
+
amplifiers = [
|
1068 |
+
r'\b(очень|крайне|чрезвычайно|совсем|полностью|чисто)\b'
|
1069 |
+
]
|
1070 |
+
|
1071 |
+
for pattern in amplifiers:
|
1072 |
+
if re.search(pattern, message, re.IGNORECASE):
|
1073 |
+
print(f"Не пройдена проверка: Усилители. Сообщение: {message}")
|
1074 |
+
return False, f"Не пройдена пр��верка на усилители: {pattern}"
|
1075 |
+
return True
|
1076 |
+
|
1077 |
+
# 15. Паразиты времени
|
1078 |
+
|
1079 |
+
def check_no_time_parasites(message):
|
1080 |
+
time_parasites = [
|
1081 |
+
r'\b(немедленно|срочно|в данный момент)\b'
|
1082 |
+
]
|
1083 |
+
|
1084 |
+
for pattern in time_parasites:
|
1085 |
+
if re.search(pattern, message, re.IGNORECASE):
|
1086 |
+
print(f"Не пройдена проверка: Паразиты времени. Сообщение: {message}")
|
1087 |
+
return False, f'Не пройдена проверка на паразитов времени: {pattern}'
|
1088 |
+
return True
|
1089 |
+
|
1090 |
+
|
1091 |
+
# 16. Несколько существительных подряд
|
1092 |
+
|
1093 |
+
def check_no_multiple_nouns(message):
|
1094 |
+
noun_count = 0
|
1095 |
+
words = re.split(r'\s+|[.!?]', message) # Разбиваем по пробелам и знакам препинания
|
1096 |
+
morph = pymorphy3.MorphAnalyzer()
|
1097 |
+
|
1098 |
+
for word in range(len(words)):
|
1099 |
+
parsed_word = morph.parse(words[word])[0]
|
1100 |
+
|
1101 |
+
# Если слово — существительное
|
1102 |
+
if 'NOUN' in parsed_word.tag:
|
1103 |
+
noun_count += 1
|
1104 |
+
# Если встречен конец предложения (точка, вопросительный знак, восклицательный знак)
|
1105 |
+
elif re.match(r'[.!?]', words[word]):
|
1106 |
+
noun_count = 0
|
1107 |
+
else:
|
1108 |
+
noun_count = 0
|
1109 |
+
|
1110 |
+
if noun_count > 2:
|
1111 |
+
print(f"Не пройдена проверка: Несколько существительных подряд. Сообщение: {message}")
|
1112 |
+
return False, f'Не пройдена проверка на несколько существительных подряд: {words[word - 2: word + 1]}'
|
1113 |
+
return True
|
1114 |
+
|
1115 |
+
|
1116 |
+
# 17. Производные предлоги
|
1117 |
+
|
1118 |
+
def check_no_derived_prepositions(message):
|
1119 |
+
derived_prepositions = [
|
1120 |
+
r'\b(в течение|в ходе|вследствие|в связи с|по мере|при помощи|согласно|вопреки|на основании|на случай|в продолжение|по причине|вблизи|вдалеке|вокруг|внутри|вдоль|посередине|вне|снаружи|благодаря|невзирая на|исходя из|благодаря)\b'
|
1121 |
+
]
|
1122 |
+
|
1123 |
+
for pattern in derived_prepositions:
|
1124 |
+
if re.search(pattern, message, re.IGNORECASE):
|
1125 |
+
print(f"Не пройдена проверка: Производные предлоги. Сообщение: {message}")
|
1126 |
+
return False, f"Не пройдена проверка на производные предлоги: {pattern}"
|
1127 |
+
return True
|
1128 |
+
|
1129 |
+
|
1130 |
+
# 19. Сложноподчиненные предложения
|
1131 |
+
|
1132 |
+
def check_no_compound_sentences(message):
|
1133 |
+
subordinating_conjunctions = [
|
1134 |
+
r'\bкогда\b', r'\bкак только\b', r'\bпока\b', r'\bпосле того как\b',
|
1135 |
+
r'\bпотому что\b', r'\bтак как\b', r'\bоттого что\b', r'\bблагодаря тому что\b',
|
1136 |
+
r'\bчтобы\b', r'\bдля того чтобы\b', r'\bесли\b', r'\bкогда бы\b', r'\bесли бы\b',
|
1137 |
+
r'\bхотя\b', r'\bнесмотря на то что\b', r'\bкак\b', r'\bбудто\b', r'\bсловно\b', r'\bкак будто\b'
|
1138 |
+
]
|
1139 |
+
|
1140 |
+
# Убедимся, что слово "как" используется не в вопросе
|
1141 |
+
for pattern in subordinating_conjunctions:
|
1142 |
+
if re.search(pattern, message) and not re.search(r'\?', message):
|
1143 |
+
print(f"Не пройдена проверка: Сложноподчиненные предложения. Сообщение: {message}")
|
1144 |
+
return False, f"Не пройдена проверка: Сложноподчиненные предложения: {pattern}"
|
1145 |
+
return True
|
1146 |
+
|
1147 |
+
|
1148 |
+
# 20. Даты прописью
|
1149 |
+
|
1150 |
+
def check_no_dates_written_out(message):
|
1151 |
+
# Ищем упоминания месяцев или слов, связанных с датами
|
1152 |
+
months = [
|
1153 |
+
"января", "февраля", "марта", "апреля", "мая", "июня",
|
1154 |
+
"июля", "августа", "сентября", "октября", "ноября", "декабря"
|
1155 |
+
]
|
1156 |
+
|
1157 |
+
# Слова для проверки чисел прописью
|
1158 |
+
date_written_out_patterns = [
|
1159 |
+
r'\b(первого|второго|третьего|четвертого|пятого|шестого|седьмого|восьмого|девятого|десятого|одиннадцатого|двенадцатого|тринадцатого|четырнадцатого|пятнадцатого|шестнадцатого|семнадцатого|восемнадцатого|девятнадцатого|двадцатого|двадцать первого|двадцать второго|двадцать третьего|двадцать четвертого|двадцать пятого|двадцать шестого|двадцать седьмого|двадцать восьмого|двадцать девятого|тридцатого|тридцать первого)\b'
|
1160 |
+
]
|
1161 |
+
|
1162 |
+
for month in months:
|
1163 |
+
for pattern in date_written_out_patterns:
|
1164 |
+
if re.search(f'{pattern}\\s{month}', message, re.IGNORECASE):
|
1165 |
+
print(f"Не пройдена проверка: Даты прописью. Сообщение: {message}")
|
1166 |
+
return False, f"Не пройдена проверка на даты прописью: {pattern}"
|
1167 |
+
|
1168 |
+
return True
|
1169 |
+
|
1170 |
+
# Доп правило. Повторы слов
|
1171 |
+
|
1172 |
+
def check_no_word_repetitions(message, key_message):
|
1173 |
+
morph = pymorphy3.MorphAnalyzer()
|
1174 |
+
|
1175 |
+
# Определяем набор частей речи, которые будем игнорировать
|
1176 |
+
ignore_pos = {
|
1177 |
+
'PREP', # Предлоги
|
1178 |
+
'CONJ', # Союзы
|
1179 |
+
'PRON', # Местоимения
|
1180 |
+
'INTJ', # Междометия
|
1181 |
+
'NUMR', # Числительные
|
1182 |
+
'PART', # Частицы
|
1183 |
+
'NPRO'
|
1184 |
+
}
|
1185 |
+
|
1186 |
+
# Разбиваем текст на слова, учитывая составные слова с дефисом
|
1187 |
+
words = re.findall(r'\b\w+(?:-\w+)*\b', message.lower())
|
1188 |
+
|
1189 |
+
# Функция для нормализации слов и получения их базовых форм
|
1190 |
+
def normalize_word(word):
|
1191 |
+
parses = morph.parse(word)
|
1192 |
+
if not parses:
|
1193 |
+
return word # Если слово не распознано, возвращаем как есть
|
1194 |
+
parse = parses[0]
|
1195 |
+
return parse.normal_form, parse.tag.POS
|
1196 |
+
|
1197 |
+
# Нормализуем ключевое сообщение и собираем его базовые формы
|
1198 |
+
key_normalized = set()
|
1199 |
+
for word in re.findall(r'\b\w+\b', key_message.lower()):
|
1200 |
+
norm, pos = normalize_word(word)
|
1201 |
+
key_normalized.add(norm)
|
1202 |
+
|
1203 |
+
# Добавляем базовые формы ключевого сообщения в игнорируемые слова
|
1204 |
+
# Это позволяет игнорировать повторения слов из ключевого сообщения
|
1205 |
+
# Кроме того, игнорируем слова из определенных частей речи
|
1206 |
+
normalized_words = {}
|
1207 |
+
|
1208 |
+
for word in words:
|
1209 |
+
norm, pos = normalize_word(word)
|
1210 |
+
|
1211 |
+
# Игнорируем слово, если оно относится к одной из игнорируемых частей речи
|
1212 |
+
if pos in ignore_pos:
|
1213 |
+
continue
|
1214 |
+
|
1215 |
+
# Игнорируем слово, если оно присутствует в ключевом сообщении
|
1216 |
+
if norm in key_normalized:
|
1217 |
+
continue
|
1218 |
+
|
1219 |
+
# Если слово уже встречалось, возвращаем False
|
1220 |
+
if norm in normalized_words:
|
1221 |
+
print(f"Не пройдена проверка: Повторы слов. Сообщение: {message}")
|
1222 |
+
return False, f"Не пройдена проверка на повторы слов: {norm}"
|
1223 |
+
|
1224 |
+
# Добавляем слово в словарь для отслеживания повторов
|
1225 |
+
normalized_words[norm] = True
|
1226 |
+
|
1227 |
+
# Если повторов не найдено, возвращаем True
|
1228 |
+
return True
|
1229 |
+
|
1230 |
+
# ФУНКЦИИ ПРОВЕРОК (КОНЕЦ)
|
1231 |
+
|
1232 |
+
def cut_message(message: str):
|
1233 |
+
if '------' in message:
|
1234 |
+
message = message.split('------')[0].strip()
|
1235 |
+
return message
|
1236 |
+
|
1237 |
+
def safe_check(func, message, key_message=None):
|
1238 |
+
try:
|
1239 |
+
# Если функция ожидает 2 аргумента (например, check_no_word_repetitions),
|
1240 |
+
# передаём key_message:
|
1241 |
+
import inspect
|
1242 |
+
sig = inspect.signature(func)
|
1243 |
+
if len(sig.parameters) == 2:
|
1244 |
+
return asyncio.run(func(message, key_message))
|
1245 |
+
else:
|
1246 |
+
return asyncio.run(func(message))
|
1247 |
+
except Exception as e:
|
1248 |
+
return None
|
1249 |
+
|
1250 |
+
def perform_checks(message, key_message):
|
1251 |
+
checks = {
|
1252 |
+
"forbidden_words": safe_check(check_forbidden_words, message),
|
1253 |
+
"client_addressing": safe_check(check_no_greeting, message),
|
1254 |
+
"promises": safe_check(check_no_promises, message),
|
1255 |
+
"double_verbs": safe_check(check_no_double_verbs, message),
|
1256 |
+
"participles": safe_check(check_no_participles, message),
|
1257 |
+
"adverbial_participles": safe_check(check_no_adverbial_participles, message),
|
1258 |
+
"superlative_adjectives": safe_check(check_no_superlative_adjectives, message),
|
1259 |
+
"passive_voice": safe_check(check_no_passive_voice, message),
|
1260 |
+
"written_out_ordinals": safe_check(check_no_written_out_ordinals, message),
|
1261 |
+
"subordinate_clauses_chain": safe_check(check_no_subordinate_clauses_chain, message),
|
1262 |
+
"repeating_conjunctions": safe_check(check_no_repeating_conjunctions, message),
|
1263 |
+
"introductory_phrases": safe_check(check_no_introductory_phrases, message),
|
1264 |
+
"amplifiers": safe_check(check_no_amplifiers, message),
|
1265 |
+
"time_parasites": safe_check(check_no_time_parasites, message),
|
1266 |
+
"multiple_nouns": safe_check(check_no_multiple_nouns, message),
|
1267 |
+
"derived_prepositions": safe_check(check_no_derived_prepositions, message),
|
1268 |
+
"compound_sentences": safe_check(check_no_compound_sentences, message),
|
1269 |
+
"dates_written_out": safe_check(check_no_dates_written_out, message),
|
1270 |
+
"no_word_repetitions": safe_check(check_no_word_repetitions, message, key_message),
|
1271 |
+
}
|
1272 |
+
return checks
|
1273 |
+
|
1274 |
+
def format_checks(checks):
|
1275 |
+
translation = {
|
1276 |
+
"forbidden_words": "Запрещенные слова",
|
1277 |
+
"client_addressing": "Обращение к клиенту",
|
1278 |
+
"promises": "Обещания и гарантии",
|
1279 |
+
"double_verbs": "Два глагола подряд",
|
1280 |
+
"participles": "Причастия",
|
1281 |
+
"adverbial_participles": "Деепричастия",
|
1282 |
+
"superlative_adjectives": "Превосходная степень",
|
1283 |
+
"passive_voice": "Страдательный залог",
|
1284 |
+
"written_out_ordinals": "Порядковые числительные",
|
1285 |
+
"subordinate_clauses_chain": "Цепочки придаточных",
|
1286 |
+
"repeating_conjunctions": "Повторяющиеся союзы",
|
1287 |
+
"introductory_phrases": "Вводные конструкции",
|
1288 |
+
"amplifiers": "Усилители",
|
1289 |
+
"time_parasites": "Паразиты времени",
|
1290 |
+
"multiple_nouns": "Сущ. подряд",
|
1291 |
+
"derived_prepositions": "Производные предлоги",
|
1292 |
+
"compound_sentences": "Сложноподчиненные предложения",
|
1293 |
+
"dates_written_out": "Даты прописью",
|
1294 |
+
"no_word_repetitions": "Повторы слов"
|
1295 |
+
}
|
1296 |
+
formatted_results = []
|
1297 |
+
for rule, result in checks.items():
|
1298 |
+
if result is True:
|
1299 |
+
symbol = '✔️'
|
1300 |
+
elif result is False:
|
1301 |
+
symbol = '❌'
|
1302 |
+
else:
|
1303 |
+
symbol = '❓'
|
1304 |
+
formatted_results.append(f"{translation[rule]}: {symbol}")
|
1305 |
+
return "\n".join(formatted_results)
|
1306 |
|
1307 |
+
|
1308 |
with gr.Blocks(theme="default") as demo:
|
1309 |
gr.Markdown("**Процент созданных SMS по выбранному продукту**")
|
1310 |
progress_bar_html = """
|
|
|
1398 |
save_sms_1_btn = gr.Button("Сохранить в базу")
|
1399 |
save_sms_2_btn = gr.Button("Сохранить в базу")
|
1400 |
|
1401 |
+
with gr.Row():
|
1402 |
+
checks_sms_1 = gr.Markdown()
|
1403 |
+
checks_sms_2 = gr.Markdown()
|
1404 |
+
|
1405 |
final_prompt_1_state = gr.State("")
|
1406 |
final_prompt_2_state = gr.State("")
|
1407 |
|