text_to_speech_ukr

Sleeping

App Files Files Community

fewe32 commited on Nov 6, 2024

Commit

2fea0af

verified ·

1 Parent(s): eafff01

Update app.py

Browse files

Files changed (1) hide show

app.py +143 -53

app.py CHANGED Viewed

@@ -1,17 +1,60 @@
 import gradio as gr
 from infer import inference
 import unicodedata
 description = '''
-Программа может не корректно определять некоторые ударения и не преобразует цифры, акронимы и разные сокращения в словесную форму.
-Если ударение неправильно, используйте символ + после ударного слога.
-Также очень короткие фразы могут вызывать сбои, поэтому пишите не одно-два слова, а что-то большее.
 '''
-# Дополнительные функции для конвертации текста
 def normalize_text(text):
     return unicodedata.normalize('NFC', text)
 def convert_accented_text(text):
     result = ""
     for char in text:
@@ -34,62 +77,109 @@ def add_pauses(text):
     text = text.replace('?', '? ... ...')
     return text
-def preprocess_text(text, should_add_pauses, convert_accent):
-    if convert_accent:
-        text = convert_accented_text(text)
-    if should_add_pauses:
-        text = add_pauses(text)
-    return text
-# Функция синтеза речи
 def synthesise(text, speed, steps, progress=gr.Progress()):
     if text.strip() == "":
-        raise gr.Error("Вы должны ввести текст")
     if len(text) > 50000:
-        raise gr.Error("Текст должен быть меньше 50k символов")
     print("*** saying ***")
     print(text)
     print("*** end ***")
-    return 24000, inference(text, progress, speed=speed, alpha=1.0, diffusion_steps=steps, embedding_scale=1.0)[0]
-# Функция для конвертации текста по кнопке
-def convert_text(text, should_add_pauses, convert_accent):
-    return preprocess_text(text, should_add_pauses, convert_accent)
-# Основной интерфейс Gradio
 if __name__ == "__main__":
-    with gr.Blocks() as demo:
-        gr.Markdown(description)
-        text_input = gr.Textbox(label='Текст:', lines=5, max_lines=10)
-        speed_slider = gr.Slider(label='Скорость:', maximum=1.3, minimum=0.7, value=1.0)
-        steps_slider = gr.Slider(label='Количество шагов диффузии:', minimum=3, maximum=20, step=1, value=3)
-        # Чекбоксы для обработки текста
-        add_pauses_checkbox = gr.Checkbox(label="Добавить паузы")
-        convert_accent_checkbox = gr.Checkbox(label="Преобразовать акценты")
-        # Кнопка для конвертации текста
-        convert_button = gr.Button("Преобразовать текст")
-        convert_output = gr.Textbox(label="Преобразованный текст")
-        # Кнопка для синтеза речи
-        synthesize_button = gr.Button("Синтезировать речь")
-        output_audio = gr.Audio(label="Аудио", autoplay=False, streaming=False, type="numpy")
-        # Связываем кнопки с функциями
-        convert_button.click(
-            fn=convert_text,
-            inputs=[text_input, add_pauses_checkbox, convert_accent_checkbox],
-            outputs=convert_output
-        )
-        synthesize_button.click(
-            fn=synthesise,
-            inputs=[convert_output, speed_slider, steps_slider],
-            outputs=output_audio
-        )
-    demo.launch(share=True, server_name="0.0.0.0")

 import gradio as gr
 from infer import inference
 import unicodedata
+import regex
 description = '''
+Програма може не коректно визначати деякі наголоси і не перетворює цифри, акроніми і різні скорочення в словесну форму.
+Якщо наголос не правильний, використовуйте символ + після наголошеного складу.
+Також дуже маленькі речення можуть крешати, тому пишіть щось більше а не одне-два слова.
 '''
+# Text Pre-processing Functions
 def normalize_text(text):
     return unicodedata.normalize('NFC', text)
+def remove_combining_chars(text):
+    decomposed = unicodedata.normalize('NFD', text)
+    filtered = ''.join(c for c in decomposed if unicodedata.category(c) != 'Mn')
+    return unicodedata.normalize('NFC', filtered)
+def adjust_case(original, replacement):
+    if original.isupper():
+        return replacement.upper()
+    elif original[0].isupper() and original[1:].islower():
+        return replacement.capitalize()
+    elif original.islower():
+        return replacement.lower()
+    else:
+        adjusted = ''
+        for o_char, r_char in zip(original, replacement):
+            if o_char.isupper():
+                adjusted += r_char.upper()
+            else:
+                adjusted += r_char.lower()
+        adjusted += replacement[len(original):]
+        return adjusted
+def replace_with_custom_dict(text, custom_dict):
+    text = normalize_text(text)
+    tokens = regex.findall(r'[\p{L}\p{M}\+]+|\s+|[^\s\p{L}\p{M}]+', text)
+    new_tokens = []
+    for token in tokens:
+        token_normalized = normalize_text(token)
+        if regex.match(r'^[\p{L}\p{M}\+]+$', token_normalized):
+            token_no_combining = remove_combining_chars(token_normalized)
+            base_token = token_no_combining.replace('+', '').lower()
+            base_token = normalize_text(base_token)
+            if base_token in custom_dict:
+                replacement = custom_dict[base_token]
+                adjusted_replacement = adjust_case(token, replacement)
+                new_tokens.append(adjusted_replacement)
+            else:
+                new_tokens.append(token)
+        else:
+            new_tokens.append(token)
+    return ''.join(new_tokens)
 def convert_accented_text(text):
     result = ""
     for char in text:
     text = text.replace('?', '? ... ...')
     return text
+# Load the custom dictionary from dict.txt
+custom_dict = {}
+with open('dict.txt', 'r', encoding='utf-8') as f:
+    for line in f:
+        line = line.strip()
+        if line:
+            line_normalized = normalize_text(line)
+            base_word = remove_combining_chars(line_normalized.replace('+', '').lower())
+            custom_dict[base_word] = line_normalized
 def synthesise(text, speed, steps, progress=gr.Progress()):
     if text.strip() == "":
+        raise gr.Error("You must enter some text")
     if len(text) > 50000:
+        raise gr.Error("Text must be <50k characters")
+    # Pre-process the text
+    text = normalize_text(text)
+    text = replace_with_custom_dict(text, custom_dict)
+    text = convert_accented_text(text)
+    # Uncomment the next line if you want to add pauses
+    # text = add_pauses(text)
     print("*** saying ***")
     print(text)
     print("*** end ***")
+    return 24000, inference(text, progress, speed=speed, alpha=1.0, diffusion_steps=steps, embedding_scale=1.0)[0]
 if __name__ == "__main__":
+    i = gr.Interface(
+        fn=synthesise,
+        description=description,
+        inputs=[
+            gr.Text(label='Text:', lines=5, max_lines=10),
+            gr.Slider(label='Швидкість:', maximum=1.3, minimum=0.7, value=1.0),
+            gr.Slider(label='Кількість кроків дифузії:', minimum=3, maximum=20, step=1, value=3)
+        ],
+        outputs=[
+            gr.Audio(
+                label="Audio:",
+                autoplay=False,
+                streaming=False,
+                type="numpy",
+            ),
+        ],
+        allow_flagging='never',
+        cache_examples=False,
+        title='StyleTTS2 Ukrainian Demo',
+        examples=[
+            [
+                '''Мені+ трина+дцятий мина+ло;:::
+Я пас ягня+та за село+м. ... ...
+Чи то так со+нечко сія+ло,:::
+Чи так мені+ чого+ було+ –:::
+Мені+ так лю+бо,::: лю+бо ста+ло,:::
+Нена+че в Бо+га. ... ... . ... ... . ... ...
+Уже+ прокли+кали до па+ю,:::
+А я собі+ у бур’яні+
+Молю+ся Бо+гу,::: і не зна+ю,:::
+Чого+ мале+нькому мені+
+Тоді+ так при+язно моли+лось,:::
+Чого+ так ве+село було+. ... ...
+Госпо+днє не+бо і село+,:::
+Ягня+,::: здає+ться,::: весели+лось,:::
+І со+нце грі+ло –::: не пекло+. ... ...
+Та не до+вго со+нце грі+ло,:::
+Не до+вго моли+лось;:::
+Запекло+,::: почервоні+ло
+І рай запали+ло. ... ...
+Мов проки+нувся,::: –::: дивлю+ся:::
+Село+ почорні+ло,:::
+Бо+же не+бо голубеє –:::
+І те помарні+ло. ... ...
+Погля+нув я на ягня+та –:::
+Не мої+ ягня+та;:::
+Оберну+вся я на ха+ти –:::
+Нема+ в мене+ ха+ти. ... ...
+Не дав мені+ Бог нічо+го! ... ...
+І хли+нули сльо+зи. ... ... . ... ... . ... ...
+Тяжкі+ сльо+зи. ... ... . ... ... . ... ...  А ді+вчи+на,:::
+При самі+й доро+зі,:::
+Недале+ко ко+ло мене+
+Пло+скінь вибира+ла,:::
+Та й почу+ла,::: що я пла+чу:::
+Прийшла+,::: привіта+ла,:::
+Утира+ла мої+ сльо+зи,:::
+І поцілува+ла. ... ... . ... ... . ... ...
+Нена+че со+нце засія+ло,:::
+Нена+че все на сві+ті ста+ло
+Моє+::: лани+,::: гаї+,::: сади+. ... ... . ... ... . ... ...
+І ми,::: жарту+ючи,::: погна+ли
+Чужі+ ягня+та до води+. ... ...
+Бридня+! ... .... ... ... . ... ...  А й до+сі,::: як згада+ю,:::
+То се+рце пла+че та боли+ть,:::
+Чому+ Госпо+дь не дав дожить
+Мало+го ві+ку у ті+м ра+ю. ... ...
+Уме+р би,::: орючи+ на ни+ві,:::
+Нічо+го б на сві+ті не знав. ... ...
+Не був би в сві+ті юроди+вим. ... ...
+Люде+й і [Бо+га] не прокля+в! ... ...''', 1.0, 6
+            ]
+        ],
+    )
+    i.queue(max_size=20, default_concurrency_limit=4)
+    i.launch(share=False, server_name="0.0.0.0")