TSjB commited on
Commit
fe27975
·
verified ·
1 Parent(s): 4a2846d

new spliting

Browse files
Files changed (1) hide show
  1. app.py +6 -1
app.py CHANGED
@@ -411,7 +411,12 @@ def translateDisp(text, from_, to, dialect):
411
  text = toModel(text)
412
 
413
  # Разбиваем текст на предложения, сохраняя знаки препинания
414
- text = re.findall(r'.+?[.!?\n](?:\s|$)', text)
 
 
 
 
 
415
 
416
  #print(f'Split text: {text}')
417
 
 
411
  text = toModel(text)
412
 
413
  # Разбиваем текст на предложения, сохраняя знаки препинания
414
+ # .+?[.!?](?:\s|$): Захватывает предложения, которые заканчиваются точкой, восклицательным или вопросительным знаком.
415
+ # |.+?(?:\n|$): Добавляет поддержку для разрыва строки (\n) или конца текста ($), если предложение не заканчивается знаком препинания.
416
+ text = re.findall(r'.+?[.!?](?:\s|$)|.+?(?:\n|$)', text)
417
+ # text бош эсе
418
+ if len(text) == 0:
419
+ text = ""
420
 
421
  #print(f'Split text: {text}')
422