Spaces:

Respair
/

Darya_TTS

Paused

App Files Files Community

Respair commited on Apr 17

Commit

2817151

verified ·

1 Parent(s): d359296

Update demo.py

Browse files

Files changed (1) hide show

demo.py +6 -6

demo.py CHANGED Viewed

@@ -191,15 +191,15 @@ with gr.Blocks() as audio_inf:
             with gr.Accordion("Advanced Parameters", open=False):
                 beta = gr.Slider(minimum=0, maximum=1, value=0.4, step=0.1,
-                                 label="Beta (Style Strength vs. Reference)",
                                  info="Diffusion parameter. Higher means LESS like the reference audio. 0 disables diffusion.",
                                  interactive=True)
                 multispeakersteps = gr.Slider(minimum=3, maximum=15, value=5, step=1,
-                                              label="Diffusion Steps",
                                               info="More steps can improve quality but increase inference time.",
                                               interactive=True)
                 embscale = gr.Slider(minimum=1, maximum=5, value=1, step=0.1,
-                                     label="Embedding Scale (Intensity)",
                                      info="Impacts expressiveness. High values (> 1.5) might cause artifacts.",
                                      interactive=True)
                 rate_of_speech = gr.Slider(minimum=0.5, maximum=2,
@@ -262,15 +262,15 @@ with gr.Blocks() as longform:
             with gr.Accordion("Advanced Parameters", open=False):
                 beta_longform = gr.Slider(minimum=0, maximum=1, value=0.4, step=0.1,
-                                          label="Beta (Style Strength vs. Semantic Prompt)",
                                           info="Diffusion parameter. Higher means LESS like the inferred style from text. 0 disables diffusion.",
                                           interactive=True)
                 diffusion_steps_longform = gr.Slider(minimum=3, maximum=15, value=5, step=1,
-                                                     label="Diffusion Steps",
                                                       info="More steps can improve quality but increase inference time.",
                                                      interactive=True)
                 embedding_scale_longform = gr.Slider(minimum=1, maximum=5, value=1, step=0.1,
-                                              label="Embedding Scale (Intensity)",
                                               info="Impacts expressiveness. High values (> 1.5) might cause artifacts.",
                                               interactive=True)
                 rate_of_speech_longform = gr.Slider(minimum=0.5, maximum=2, value=1, step=0.1,

             with gr.Accordion("Advanced Parameters", open=False):
                 beta = gr.Slider(minimum=0, maximum=1, value=0.4, step=0.1,
+                                 label="Beta (Diffusion Strength vs. Reference) - Kalliope Only",
                                  info="Diffusion parameter. Higher means LESS like the reference audio. 0 disables diffusion.",
                                  interactive=True)
                 multispeakersteps = gr.Slider(minimum=3, maximum=15, value=5, step=1,
+                                              label="Diffusion Steps - Kalliope Only",
                                               info="More steps can improve quality but increase inference time.",
                                               interactive=True)
                 embscale = gr.Slider(minimum=1, maximum=5, value=1, step=0.1,
+                                     label="Embedding Scale (Intensity) - Kalliope Only",
                                      info="Impacts expressiveness. High values (> 1.5) might cause artifacts.",
                                      interactive=True)
                 rate_of_speech = gr.Slider(minimum=0.5, maximum=2,
             with gr.Accordion("Advanced Parameters", open=False):
                 beta_longform = gr.Slider(minimum=0, maximum=1, value=0.4, step=0.1,
+                                          label="Beta (Diffusion Strength vs. Semantic Encoder) - Kalliope Only",
                                           info="Diffusion parameter. Higher means LESS like the inferred style from text. 0 disables diffusion.",
                                           interactive=True)
                 diffusion_steps_longform = gr.Slider(minimum=3, maximum=15, value=5, step=1,
+                                                     label="Diffusion Steps - Kalliope Only",
                                                       info="More steps can improve quality but increase inference time.",
                                                      interactive=True)
                 embedding_scale_longform = gr.Slider(minimum=1, maximum=5, value=1, step=0.1,
+                                              label="Embedding Scale (Intensity) - Kalliope Only",
                                               info="Impacts expressiveness. High values (> 1.5) might cause artifacts.",
                                               interactive=True)
                 rate_of_speech_longform = gr.Slider(minimum=0.5, maximum=2, value=1, step=0.1,