Spaces:

fruitpicker01
/

Test_Pipeline_v10

Sleeping

App Files Files Community

fruitpicker01 commited on Dec 25, 2024

Commit

0062f1c

verified ·

1 Parent(s): 07c5cb4

Update app.py

Browse files

Files changed (1) hide show

app.py +27 -16

app.py CHANGED Viewed

@@ -1559,48 +1559,59 @@ def check_no_time_parasites(message, exceptions=None):
 def check_no_multiple_nouns(message, exceptions=None):
     """
-    Проверка на 3+ подряд существительных (в рамках одного предложения).
     Если конкретная цепочка лемм не в exceptions['multiple_nouns'], считаем нарушением.
     """
     if exceptions is None:
         exceptions = {}
     allowed_chains = exceptions.get("multiple_nouns", set())
     morph = pymorphy3.MorphAnalyzer()
-    # Разбиваем текст на предложения.
     sentences = re.split(r'[.!?]\s*|\n+', message.strip())
     for sentence in sentences:
         sentence = sentence.strip()
         if not sentence:
             continue
-        # Теперь разбиваем *предложение* на токены (знаки препинания / пробелы и т.п.)
-        tokens = re.split(r'[,\s;:\(\)"«»–—]+', sentence)
         chain = []
         count = 0
-        for t in tokens:
-            w = t.strip()
-            if not w:
                 continue
-            parsed = morph.parse(w)[0]
-            if 'NOUN' in parsed.tag:
                 count += 1
-                chain.append(parsed.normal_form)
             else:
-                # как только встретили не-сущ., сбрасываем
                 count = 0
-                chain = []
-            # Если встретили 3 подряд
             if count > 2:
                 chain_tuple = tuple(chain)
                 if chain_tuple not in allowed_chains:
-                    return (False, f"Несколько существительных подряд: {chain_tuple}")
     return True
 # 17. Производные предлоги

 def check_no_multiple_nouns(message, exceptions=None):
     """
+    Проверка на 3+ подряд существительных в рамках одного предложения,
+    учитывая, что любой знак пунктуации тоже прерывает цепочку.
     Если конкретная цепочка лемм не в exceptions['multiple_nouns'], считаем нарушением.
     """
+    import re
+    import pymorphy3
     if exceptions is None:
         exceptions = {}
     allowed_chains = exceptions.get("multiple_nouns", set())
     morph = pymorphy3.MorphAnalyzer()
+    # 1) Разбиваем весь текст на предложения по . ! ? или переводам строк
     sentences = re.split(r'[.!?]\s*|\n+', message.strip())
     for sentence in sentences:
         sentence = sentence.strip()
         if not sentence:
             continue
+        # 2) Внутри одного предложения извлекаем либо слово (\w+), либо "пунктуацию" ([^\w\s]+)
+        #    \w+ = буквенно-цифровая последовательность
+        #    [^\w\s]+ = "не-слово", "не-пробел" => любой набор знаков пунктуации
+        tokens = re.findall(r'\w+|[^\w\s]+', sentence)
         chain = []
         count = 0
+        for token in tokens:
+            # 3) Если это набор пунктуации, сбрасываем цепочку
+            if re.match(r'[^\w\s]+', token):
+                count = 0
+                chain.clear()
                 continue
+            # Иначе это слово => проверяем, NOUN ли это
+            p = morph.parse(token)[0]
+            if 'NOUN' in p.tag:
                 count += 1
+                chain.append(p.normal_form)
             else:
                 count = 0
+                chain.clear()
+            # 4) Если встретили 3+ подряд
             if count > 2:
                 chain_tuple = tuple(chain)
                 if chain_tuple not in allowed_chains:
+                    return False, f"Несколько существительных подряд: {chain_tuple}"
     return True
 # 17. Производные предлоги