Spaces:

M4xjunior
/

locseed

Sleeping

App Files Files Community

M4xjunior commited on Nov 30, 2024

Commit

1384004

verified ·

1 Parent(s): 3fb5c42

Update app.py

Browse files

Files changed (1) hide show

app.py +17 -15

app.py CHANGED Viewed

@@ -117,10 +117,6 @@ with gr.Blocks(css=custom_css) as app:
             gen_text_input = gr.Textbox(label="Texto para Gerar", lines=10)
             generate_btn = gr.Button("Sintetizar", variant="primary")
-            # Container para as sentenças
-            with gr.Row(elem_id="sentences-container"):
-                sentences_output = gr.Textbox(label="Sentenças", lines=10, interactive=False)
             with gr.Accordion("Configurações Avançadas", open=False):
                 ref_text_input = gr.Textbox(
                     label="Texto de Referência",
@@ -148,6 +144,15 @@ with gr.Blocks(css=custom_css) as app:
                     step=0.01,
                     info="Defina a duração do cross-fade entre os clipes de áudio.",
                 )
             audio_output = gr.Audio(label="Áudio Sintetizado")
             spectrogram_output = gr.Image(label="Espectrograma")
@@ -161,24 +166,19 @@ with gr.Blocks(css=custom_css) as app:
                 remove_silence,
                 cross_fade_duration_slider,
                 speed_slider,
             ):
                 # Divida o texto em sentenças
                 sentences = analyzer.split_into_sentences(gen_text_input)
-                # Exiba as sentenças com formatação
-                formatted_sentences = "".join([
-                    f'<div class="sentence-box">{sentence}</div>'
-                    for sentence in sentences
-                ])
-                sentences_output = formatted_sentences  # Correção aqui
-                # Gere áudio para cada sentença individualmente
                 audio_segments = []
-                for sentence in sentences:
                     audio_out, spectrogram_path, ref_text_out = infer(
                         ref_audio_input,
                         ref_text_input,
-                        sentence,  # Gere áudio para a sentença atual
                         remove_silence,
                         cross_fade_duration_slider,
                         speed_slider,
@@ -203,9 +203,11 @@ with gr.Blocks(css=custom_css) as app:
                     remove_silence,
                     cross_fade_duration_slider,
                     speed_slider,
                 ],
-                outputs=[audio_output, spectrogram_output, ref_text_input],
             )
         with gr.Tab("Multi-Speech"):
             gr.Markdown("# Geração Multi-Speech com F5-TTS")

             gen_text_input = gr.Textbox(label="Texto para Gerar", lines=10)
             generate_btn = gr.Button("Sintetizar", variant="primary")
             with gr.Accordion("Configurações Avançadas", open=False):
                 ref_text_input = gr.Textbox(
                     label="Texto de Referência",
                     step=0.01,
                     info="Defina a duração do cross-fade entre os clipes de áudio.",
                 )
+                sentence_count_slider = gr.Slider(
+                    label="Número de Sentenças por Vez",
+                    minimum=1,
+                    maximum=10,
+                    value=1,
+                    step=1,
+                    info="Selecione quantas sentenças serão geradas por vez.",
+                )
             audio_output = gr.Audio(label="Áudio Sintetizado")
             spectrogram_output = gr.Image(label="Espectrograma")
                 remove_silence,
                 cross_fade_duration_slider,
                 speed_slider,
+                sentence_count_slider,
             ):
                 # Divida o texto em sentenças
                 sentences = analyzer.split_into_sentences(gen_text_input)
+                num_sentences = min(len(sentences), sentence_count_slider)
+                # Gere áudio para o número selecionado de sentenças
                 audio_segments = []
+                for i in range(num_sentences):
                     audio_out, spectrogram_path, ref_text_out = infer(
                         ref_audio_input,
                         ref_text_input,
+                        sentences[i],
                         remove_silence,
                         cross_fade_duration_slider,
                         speed_slider,
                     remove_silence,
                     cross_fade_duration_slider,
                     speed_slider,
+                    sentence_count_slider,
                 ],
+                outputs=[audio_output, spectrogram_output],
             )
         with gr.Tab("Multi-Speech"):
             gr.Markdown("# Geração Multi-Speech com F5-TTS")