Emil25 commited on
Commit
4996e81
·
verified ·
1 Parent(s): 8e8e554

Update app.py

Browse files
Files changed (1) hide show
  1. app.py +18 -0
app.py CHANGED
@@ -75,21 +75,39 @@ def preprocess_input(input_text):
75
  Функция для предварительной обработки входного текста.
76
  Убирает лишние символы, исправляет предложения.
77
  """
 
78
  input_text = input_text.split(":")[-1].strip()
 
 
79
  sentences = sent_tokenize(input_text)
 
 
80
  if len(sentences) == 0:
81
  return ""
 
 
82
  last_sentence = sentences[-1]
83
  if not last_sentence.endswith('.'):
84
  sentences.pop()
 
85
  corrected_sentences = []
 
 
86
  for sentence in sentences:
87
  words = word_tokenize(sentence)
88
  if len(words) > 0:
 
89
  words[0] = words[0].capitalize()
90
  corrected_sentence = ' '.join(words)
91
  corrected_sentences.append(corrected_sentence)
 
 
92
  final_text = ' '.join(corrected_sentences)
 
 
 
 
 
93
  return final_text
94
 
95
 
 
75
  Функция для предварительной обработки входного текста.
76
  Убирает лишние символы, исправляет предложения.
77
  """
78
+ # Удаляем лишние символы и извлекаем текст после двоеточия
79
  input_text = input_text.split(":")[-1].strip()
80
+
81
+ # Токенизация предложений
82
  sentences = sent_tokenize(input_text)
83
+
84
+ # Проверка на наличие предложений
85
  if len(sentences) == 0:
86
  return ""
87
+
88
+ # Удаляем последнее предложение, если оно не заканчивается на точку
89
  last_sentence = sentences[-1]
90
  if not last_sentence.endswith('.'):
91
  sentences.pop()
92
+
93
  corrected_sentences = []
94
+
95
+ # Исправление предложений
96
  for sentence in sentences:
97
  words = word_tokenize(sentence)
98
  if len(words) > 0:
99
+ # Капитализация первого слова
100
  words[0] = words[0].capitalize()
101
  corrected_sentence = ' '.join(words)
102
  corrected_sentences.append(corrected_sentence)
103
+
104
+ # Объединение исправленных предложений в финальный текст
105
  final_text = ' '.join(corrected_sentences)
106
+
107
+ # Добавление точки в конце, если финальный текст не пустой
108
+ if final_text and not final_text.endswith('.'):
109
+ final_text += '.'
110
+
111
  return final_text
112
 
113