Spaces:

goooofy
/

zerovox-demo

Running

App Files Files Community

Guenter Bartsch commited on Oct 21, 2024

Commit

b8c03ff

1 Parent(s): 41889ec

update UI

Browse files

Files changed (2) hide show

.gitignore +1 -0
app.py +10 -11

.gitignore ADDED Viewed

	@@ -0,0 +1 @@


1	+ run.sh

app.py CHANGED Viewed

@@ -24,11 +24,11 @@ def update_text_input():
         st.session_state.text = "Welcome to the world of speech synthesis!"
     elif st.session_state['lang'] == "de":
         st.session_state.text = "Willkommen in der Welt der Sprachsynthese!"
-    text = st.session_state.text
 def do_synth():
-    global lang, status, speakerref, text, playback, meldec
     synth = None
@@ -68,7 +68,7 @@ def do_synth():
     start_time = time.time()
-    wav, phoneme, length = synth.tts(text, spkemb)
     elapsed_time = time.time() - start_time
@@ -88,33 +88,32 @@ def do_synth():
 st.markdown("# ZeroVOX TTS Demo\n\nZeroVOX is a zero-shot realtime TTS system, fully offline, free and open source.\n\nFor more information, check out\n[https://github.com/gooofy/zerovox](https://github.com/gooofy/zerovox)\n")
-col1, col2, col3 = st.columns(3)
-with col1:
     lang = st.selectbox("Language",
                         ["en", "de"],
                         on_change=update_text_input,
                         key='lang')
-with col2:
     speakers = [s for s in ZeroVoxTTS.available_speakerrefs()]
     speakerref = st.selectbox("Voice sample", speakers, index=speakers.index(DEFAULT_SPEAKER))
     st.audio(ZeroVoxTTS.get_speakerref(speakerref, SAMPLE_RATE), sample_rate=SAMPLE_RATE)
-with col3:
     meldec = st.selectbox("MEL decoder",
                         ["meldec-libritts-multi-band-melgan-v2", "meldec-libritts-hifigan-v1"],
                         #on_change=update_text_input,
                         key='meldec')
-text = st.text_input("Text to synthesize", value=st.session_state.text)
-st.button("Synthesize!", type="primary", on_click=do_synth)
-status = st.status(st.session_state.message, state="complete")
 if 'wav' in st.session_state:

         st.session_state.text = "Welcome to the world of speech synthesis!"
     elif st.session_state['lang'] == "de":
         st.session_state.text = "Willkommen in der Welt der Sprachsynthese!"
+    #text = st.session_state.text
 def do_synth():
+    global lang, status, speakerref, playback, meldec
     synth = None
     start_time = time.time()
+    wav, phoneme, length = synth.tts(st.session_state.text, spkemb)
     elapsed_time = time.time() - start_time
 st.markdown("# ZeroVOX TTS Demo\n\nZeroVOX is a zero-shot realtime TTS system, fully offline, free and open source.\n\nFor more information, check out\n[https://github.com/gooofy/zerovox](https://github.com/gooofy/zerovox)\n")
+tab1, tab2 = st.tabs(["Settings", "MEL Decoder"])
+with tab1:
     lang = st.selectbox("Language",
                         ["en", "de"],
                         on_change=update_text_input,
                         key='lang')
     speakers = [s for s in ZeroVoxTTS.available_speakerrefs()]
     speakerref = st.selectbox("Voice sample", speakers, index=speakers.index(DEFAULT_SPEAKER))
     st.audio(ZeroVoxTTS.get_speakerref(speakerref, SAMPLE_RATE), sample_rate=SAMPLE_RATE)
+with tab2:
     meldec = st.selectbox("MEL decoder",
                         ["meldec-libritts-multi-band-melgan-v2", "meldec-libritts-hifigan-v1"],
                         #on_change=update_text_input,
                         key='meldec')
+status = st.status(st.session_state.message, state="complete")
+#text = st.text_input("Text to synthesize", value=st.session_state.text, key='text', on_change=do_synth)
+text = st.text_input("Text to synthesize", key='text', on_change=do_synth)
+st.button("Synthesize!", type="primary", on_click=do_synth)
 if 'wav' in st.session_state: