text_to_speech_ukr

Running

App Files Files Community

fewe32 commited on Nov 6, 2024

Commit

30f3747

verified ·

1 Parent(s): 61c3568

Update app.py

Browse files

Files changed (1) hide show

app.py +58 -54

app.py CHANGED Viewed

@@ -3,27 +3,20 @@ from infer import inference
 import unicodedata
 import regex
-# Основное описание
 description = '''
 Програма може не коректно визначати деякі наголоси і не перетворює цифри, акроніми і різні скорочення в словесну форму.
 Якщо наголос не правильний, використовуйте символ + після наголошеного складу.
 Також дуже маленькі речення можуть крешати, тому пишіть щось більше а не одне-два слова.
 '''
-# Дополнительные функции для обработки текста
 def normalize_text(text):
     return unicodedata.normalize('NFC', text)
-def add_pauses(text):
-    text = text.replace(':', ':::')
-    text = text.replace(',', ',:::')
-    text = text.replace(';', ';:::')
-    text = text.replace('—', '—:::')
-    text = text.replace('–', '–:::')
-    text = text.replace('.', '. ... ... ')
-    text = text.replace('!', '! ... ...')
-    text = text.replace('?', '? ... ...')
-    return text
 def convert_accented_text(text):
     result = ""
@@ -36,62 +29,73 @@ def convert_accented_text(text):
             result += unicodedata.normalize('NFC', char)
     return result
-def preprocess_text(text, add_pauses, convert_accent):
     if convert_accent:
         text = convert_accented_text(text)
-    if add_pauses:
         text = add_pauses(text)
     return text
-# Функция синтеза
-def synthesise(text, speed, steps, add_pauses, convert_accent, progress=gr.Progress()):
     if text.strip() == "":
         raise gr.Error("You must enter some text")
     if len(text) > 50000:
         raise gr.Error("Text must be <50k characters")
-    # Применяем обработку в зависимости от флагов чекбоксов
-    text = preprocess_text(text, add_pauses, convert_accent)
     print("*** saying ***")
     print(text)
     print("*** end ***")
     return 24000, inference(text, progress, speed=speed, alpha=1.0, diffusion_steps=steps, embedding_scale=1.0)[0]
-# Запуск интерфейса
 if __name__ == "__main__":
-    i = gr.Interface(
-        fn=synthesise,
-        description=description,
-        inputs=[
-            gr.Text(label='Text:', lines=5, max_lines=10),
-            gr.Slider(label='Швидкість:', maximum=1.3, minimum=0.7, value=1.0),
-            gr.Slider(label='Кількість кроків дифузії:', minimum=3, maximum=20, step=1, value=3),
-            gr.Checkbox(label="Add pauses", value=False),
-            gr.Checkbox(label="Convert accented text", value=False)
-        ],
-        outputs=[
-            gr.Audio(
-                label="Audio:",
-                autoplay=False,
-                streaming=False,
-                type="numpy",
-            ),
-        ],
-        allow_flagging='never',
-        cache_examples=False,
-        title='StyleTTS2 Ukrainian Demo',
-        examples=[
-            ["Решта окупантів звернула на Вокзальну — центральну вулицю Бучі...", 1.0, 6, False, False],
-            ["Одна дівчинка стала королевою Франції. Звали її Анна...", 1.0, 6, True, True],
-            [
-                '''Одного разу, в невеликому місті, в якому все йшло за своїм розпорядком,
-                з’явився мандрівник з далекої країни. Він розповів жителям про дивовижні землі,
-                що знаходяться далеко за горизонтом, і про скарби, що чекають на тих, хто наважиться
-                на небезпечну подорож...''', 1.0, 6, True, False
-            ]
-        ],
-    )
-    i.queue(max_size=20, default_concurrency_limit=4)
-    i.launch(share=False, server_name="0.0.0.0")

 import unicodedata
 import regex
 description = '''
 Програма може не коректно визначати деякі наголоси і не перетворює цифри, акроніми і різні скорочення в словесну форму.
 Якщо наголос не правильний, використовуйте символ + після наголошеного складу.
 Також дуже маленькі речення можуть крешати, тому пишіть щось більше а не одне-два слова.
 '''
+# Дополнительные функции для конвертации текста
 def normalize_text(text):
     return unicodedata.normalize('NFC', text)
+def remove_combining_chars(text):
+    decomposed = unicodedata.normalize('NFD', text)
+    filtered = ''.join(c for c in decomposed if unicodedata.category(c) != 'Mn')
+    return unicodedata.normalize('NFC', filtered)
 def convert_accented_text(text):
     result = ""
             result += unicodedata.normalize('NFC', char)
     return result
+def add_pauses(text):
+    text = text.replace(':', ':::')
+    text = text.replace(',', ',:::')
+    text = text.replace(';', ';:::')
+    text = text.replace('—', '—:::')
+    text = text.replace('–', '–:::')
+    text = text.replace('.', '. ... ... ')
+    text = text.replace('!', '! ... ...')
+    text = text.replace('?', '? ... ...')
+    return text
+def preprocess_text(text, should_add_pauses, convert_accent):
     if convert_accent:
         text = convert_accented_text(text)
+    if should_add_pauses:
         text = add_pauses(text)
     return text
+# Функция синтеза речи
+def synthesise(text, speed, steps, progress=gr.Progress()):
     if text.strip() == "":
         raise gr.Error("You must enter some text")
     if len(text) > 50000:
         raise gr.Error("Text must be <50k characters")
     print("*** saying ***")
     print(text)
     print("*** end ***")
     return 24000, inference(text, progress, speed=speed, alpha=1.0, diffusion_steps=steps, embedding_scale=1.0)[0]
+# Функция для конвертации текста по кнопке
+def convert_text(text, should_add_pauses, convert_accent):
+    return preprocess_text(text, should_add_pauses, convert_accent)
+# Основной интерфейс Gradio
 if __name__ == "__main__":
+    with gr.Blocks() as demo:
+        gr.Markdown(description)
+        text_input = gr.Textbox(label='Text:', lines=5, max_lines=10)
+        speed_slider = gr.Slider(label='Швидкість:', maximum=1.3, minimum=0.7, value=1.0)
+        steps_slider = gr.Slider(label='Кількість кроків дифузії:', minimum=3, maximum=20, step=1, value=3)
+        # Чекбоксы для обработки текста
+        add_pauses_checkbox = gr.Checkbox(label="Add pauses")
+        convert_accent_checkbox = gr.Checkbox(label="Convert accented characters")
+        # Кнопка для конвертации текста
+        convert_button = gr.Button("Convert Text")
+        convert_output = gr.Textbox(label="Converted Text")
+        # Кнопка для синтеза речи
+        synthesize_button = gr.Button("Synthesize Speech")
+        output_audio = gr.Audio(label="Audio", autoplay=False, streaming=False, type="numpy")
+        # Связываем кнопки с функциями
+        convert_button.click(
+            fn=convert_text,
+            inputs=[text_input, add_pauses_checkbox, convert_accent_checkbox],
+            outputs=convert_output
+        )
+        synthesize_button.click(
+            fn=synthesise,
+            inputs=[convert_output, speed_slider, steps_slider],
+            outputs=output_audio
+        )
+    demo.launch(share=True, server_name="0.0.0.0")