Spaces:

RafaG
/

TTS-Rapido

Running

App Files Files Community

RafaG commited on Mar 23

Commit

1bdb9d8

verified ·

1 Parent(s): 293a37a

Update app.py

Browse files

Files changed (1) hide show

app.py +8 -25

app.py CHANGED Viewed

@@ -13,21 +13,17 @@ import pysrt
 from tqdm import tqdm
 import shutil
-# Controla se a pasta temporária srt_temp será apagada após gerar o áudio
-srt_temp_deleta = True  # True apaga, False mantém
-# Load voices from JSON file
 def load_voices():
     with open('voices.json', 'r', encoding='utf-8') as f:
         return json.load(f)
-# Get formatted voice options for specific language
 def get_voice_options(language, voices_data):
     if language in voices_data:
         return [f"{voice['name']} | {voice['gender']}" for voice in voices_data[language]]
     return []
-# Extract voice name from formatted string
 def extract_voice_name(formatted_voice):
     return formatted_voice.split(" | ")[0]
@@ -58,12 +54,10 @@ def remove_silence(input_file, output_file):
 def controlador_generate_audio(audio_input, voice_model_input, speed_input, pitch_input, volume_input, checkbox_cortar_silencio):
     audio_file = generate_audio(audio_input, voice_model_input, speed_input, pitch_input, volume_input)
-    if audio_file:
-        print("Áudio gerado com sucesso:", audio_file)
         if checkbox_cortar_silencio:
-            print("Cortando silêncio...")
             remove_silence(audio_file, audio_file)
-            print("Silêncio removido com sucesso!")
     else:
         print("Erro ao gerar áudio.")
     return audio_file
@@ -146,7 +140,6 @@ def controlador_generate_audio_from_file(file, voice_model_input, speed_input, p
     return audio_file
-# Funções adaptadas do TTS.py para processar SRT com ajuste de velocidade
 def timetoms(time_obj):
     return time_obj.hours * 3600000 + time_obj.minutes * 60000 + time_obj.seconds * 1000 + time_obj.milliseconds
@@ -167,7 +160,7 @@ async def merge_audio_files(output_folder, srt_file):
             if audio_file.exists():
                 audio = AudioSegment.from_mp3(str(audio_file))
-                audio_segment = audio  # Já ajustado anteriormente
             else:
                 print(f"\nArquivo de áudio não encontrado: {audio_file}")
                 audio_segment = AudioSegment.silent(duration=end_time - start_time)
@@ -203,13 +196,9 @@ async def adjust_audio_speed(input_file, output_file, target_duration_ms):
         print(f"Erro: Áudio em {input_file} tem duração zero.")
         return audio
-    speed_factor = original_duration_ms / target_duration_ms
-    print(f"Fator de velocidade calculado: {speed_factor:.2f}x (original: {original_duration_ms}ms, alvo: {target_duration_ms}ms)")
-    # Ajustar a velocidade usando pydub
     adjusted_audio = audio.speedup(playback_speed=speed_factor) if speed_factor > 1 else audio._spawn(audio.raw_data, overrides={"frame_rate": int(audio.frame_rate * speed_factor)})
-    # Garantir que a duração ajustada seja próxima do alvo
     if len(adjusted_audio) > target_duration_ms:
         adjusted_audio = adjusted_audio[:target_duration_ms]
     elif len(adjusted_audio) < target_duration_ms:
@@ -240,14 +229,12 @@ async def process_srt_file(srt_file, voice, output_dir, pitch, volume):
                 target_duration_ms = timetoms(sub.end) - timetoms(sub.start)
                 if not output_file.exists() or output_file.stat().st_size == 0:
-                    # Gerar áudio inicial sem ajuste de velocidade
                     tts = EdgeTTS(text=sub.text, voice=voice, pitch=pitch_str, volume=volume_str)
                     tasks.append(tts.save(str(temp_file)))
             if tasks:
                 await asyncio.gather(*tasks)
-            # Ajustar velocidade para cada áudio gerado no batch
             for i in batch:
                 sub = subs[i]
                 temp_file = output_dir / f"{sub.index:02d}_temp.mp3"
@@ -256,12 +243,11 @@ async def process_srt_file(srt_file, voice, output_dir, pitch, volume):
                 if temp_file.exists():
                     await adjust_audio_speed(temp_file, output_file, target_duration_ms)
-                    os.remove(temp_file)  # Remover arquivo temporário
                 pbar.update(1)
     final_audio = await merge_audio_files(output_dir, srt_file)
-    # Apagar a pasta temporária se srt_temp_deleta for True
     if srt_temp_deleta:
         shutil.rmtree(output_dir, ignore_errors=True)
         print(f"Pasta temporária {output_dir} apagada.")
@@ -280,7 +266,6 @@ def controlador_process_srt_file(srt_file, voice_model_input, pitch_input, volum
     audio_file = asyncio.run(process_srt_file(srt_file, actual_voice, output_dir, pitch_input, volume_input))
     return audio_file
-# Funções para a aba "Arquivos gerados"
 def listar_audios():
     try:
         srt_output_dir = "output/srt_output"
@@ -294,7 +279,6 @@ def listar_audios():
         return ["Erro ao listar arquivos"]
 def tocar_audio(arquivo):
-    # Retorna o caminho do arquivo para reprodução, se válido
     if arquivo and arquivo != "Nenhum áudio gerado ainda":
         return f"output/srt_output/{arquivo}"
     return None
@@ -440,7 +424,6 @@ with gr.Blocks(theme=gr.themes.Default(primary_hue="green", secondary_hue="blue"
                         srt_button = gr.Button(value="Gerar Áudio")
                         clear_button_srt = gr.ClearButton(srt_input, value='Limpar')
-                    # Função para gerar áudio e atualizar a lista
                     def generate_and_update_list(srt_file, voice_model_input, pitch_input, volume_input):
                         audio_file = controlador_process_srt_file(srt_file, voice_model_input, pitch_input, volume_input)
                         updated_list = listar_audios()
@@ -449,8 +432,8 @@ with gr.Blocks(theme=gr.themes.Default(primary_hue="green", secondary_hue="blue"
                     srt_button.click(
                         fn=generate_and_update_list,
                         inputs=[srt_input, voice_model_input_srt, pitch_input_srt, volume_input_srt],
-                        outputs=[audio_output_srt, gr.Dropdown(visible=False)],  # Componente oculto para a lista
-                        queue=True  # Garantir que o evento seja processado na fila
                     )
                     gr.Markdown("Agradecimentos a rany2 pelo Edge-TTS")

 from tqdm import tqdm
 import shutil
+srt_temp_deleta = True
 def load_voices():
     with open('voices.json', 'r', encoding='utf-8') as f:
         return json.load(f)
 def get_voice_options(language, voices_data):
     if language in voices_data:
         return [f"{voice['name']} | {voice['gender']}" for voice in voices_data[language]]
     return []
 def extract_voice_name(formatted_voice):
     return formatted_voice.split(" | ")[0]
 def controlador_generate_audio(audio_input, voice_model_input, speed_input, pitch_input, volume_input, checkbox_cortar_silencio):
     audio_file = generate_audio(audio_input, voice_model_input, speed_input, pitch_input, volume_input)
+    if audio_file:
         if checkbox_cortar_silencio:
             remove_silence(audio_file, audio_file)
     else:
         print("Erro ao gerar áudio.")
     return audio_file
     return audio_file
 def timetoms(time_obj):
     return time_obj.hours * 3600000 + time_obj.minutes * 60000 + time_obj.seconds * 1000 + time_obj.milliseconds
             if audio_file.exists():
                 audio = AudioSegment.from_mp3(str(audio_file))
+                audio_segment = audio
             else:
                 print(f"\nArquivo de áudio não encontrado: {audio_file}")
                 audio_segment = AudioSegment.silent(duration=end_time - start_time)
         print(f"Erro: Áudio em {input_file} tem duração zero.")
         return audio
+    speed_factor = original_duration_ms / target_duration_ms
     adjusted_audio = audio.speedup(playback_speed=speed_factor) if speed_factor > 1 else audio._spawn(audio.raw_data, overrides={"frame_rate": int(audio.frame_rate * speed_factor)})
     if len(adjusted_audio) > target_duration_ms:
         adjusted_audio = adjusted_audio[:target_duration_ms]
     elif len(adjusted_audio) < target_duration_ms:
                 target_duration_ms = timetoms(sub.end) - timetoms(sub.start)
                 if not output_file.exists() or output_file.stat().st_size == 0:
                     tts = EdgeTTS(text=sub.text, voice=voice, pitch=pitch_str, volume=volume_str)
                     tasks.append(tts.save(str(temp_file)))
             if tasks:
                 await asyncio.gather(*tasks)
             for i in batch:
                 sub = subs[i]
                 temp_file = output_dir / f"{sub.index:02d}_temp.mp3"
                 if temp_file.exists():
                     await adjust_audio_speed(temp_file, output_file, target_duration_ms)
+                    os.remove(temp_file)
                 pbar.update(1)
     final_audio = await merge_audio_files(output_dir, srt_file)
     if srt_temp_deleta:
         shutil.rmtree(output_dir, ignore_errors=True)
         print(f"Pasta temporária {output_dir} apagada.")
     audio_file = asyncio.run(process_srt_file(srt_file, actual_voice, output_dir, pitch_input, volume_input))
     return audio_file
 def listar_audios():
     try:
         srt_output_dir = "output/srt_output"
         return ["Erro ao listar arquivos"]
 def tocar_audio(arquivo):
     if arquivo and arquivo != "Nenhum áudio gerado ainda":
         return f"output/srt_output/{arquivo}"
     return None
                         srt_button = gr.Button(value="Gerar Áudio")
                         clear_button_srt = gr.ClearButton(srt_input, value='Limpar')
                     def generate_and_update_list(srt_file, voice_model_input, pitch_input, volume_input):
                         audio_file = controlador_process_srt_file(srt_file, voice_model_input, pitch_input, volume_input)
                         updated_list = listar_audios()
                     srt_button.click(
                         fn=generate_and_update_list,
                         inputs=[srt_input, voice_model_input_srt, pitch_input_srt, volume_input_srt],
+                        outputs=[audio_output_srt, gr.Dropdown(visible=False)],
+                        queue=True
                     )
                     gr.Markdown("Agradecimentos a rany2 pelo Edge-TTS")