Spaces:

englissi
/

bgtts

Running

englissi commited on Feb 10

Commit

564910c

verified ·

1 Parent(s): ebb2d0b

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -10,10 +10,10 @@ def text_to_speech(prompt):
     audio_file = "output.mp3"
     tts.save(audio_file)
-    # pydub으로 mp3 파일 불러오기
     sound = AudioSegment.from_mp3(audio_file)
-    # pydub가 제공하는 raw 데이터를 NumPy 배열로 변환 (int16)
     samples = np.array(sound.get_array_of_samples())
     # 만약 스테레오라면 모노로 변환 (채널 평균)
@@ -25,17 +25,21 @@ def text_to_speech(prompt):
     samples = samples.astype(np.float32) / 32768.0
     sample_rate = sound.frame_rate
-    # 임시 파일 삭제
     os.remove(audio_file)
     return samples, sample_rate
 with gr.Blocks() as demo:
     gr.Markdown("## Bulgarian Text-to-Speech (TTS)")
-    input_prompt = gr.Textbox(label="Enter a prompt in Bulgarian:")
-    output_audio = gr.Audio(label="Generated Speech", type="numpy")
     generate_button = gr.Button("Generate Speech")
     generate_button.click(text_to_speech, inputs=input_prompt, outputs=output_audio)
-demo.launch()

     audio_file = "output.mp3"
     tts.save(audio_file)
+    # pydub를 사용하여 mp3 파일을 불러옵니다.
     sound = AudioSegment.from_mp3(audio_file)
+    # pydub의 raw 데이터를 numpy 배열로 변환 (int16)
     samples = np.array(sound.get_array_of_samples())
     # 만약 스테레오라면 모노로 변환 (채널 평균)
     samples = samples.astype(np.float32) / 32768.0
     sample_rate = sound.frame_rate
+    # 임시로 생성한 mp3 파일 삭제
     os.remove(audio_file)
+    # gr.Audio(type="numpy")는 (numpy_array, sample_rate) 튜플을 기대합니다.
     return samples, sample_rate
 with gr.Blocks() as demo:
     gr.Markdown("## Bulgarian Text-to-Speech (TTS)")
+    with gr.Row():
+        input_prompt = gr.Textbox(label="Enter a prompt in Bulgarian:")
+        # type을 "numpy"로 설정하여 numpy 배열을 사용합니다.
+        output_audio = gr.Audio(label="Generated Speech", type="numpy")
     generate_button = gr.Button("Generate Speech")
     generate_button.click(text_to_speech, inputs=input_prompt, outputs=output_audio)
+if __name__ == "__main__":
+    demo.launch()