import gradio as gr from inference import text_to_speech import logging logger=logging.getLogger("app") logger.setLevel(logging.INFO) with gr.Blocks() as demo: gr.Markdown("""# Text-to-Speech Gustavo Petro Fine-tuned [VITS](https://github.com/statscol/tts-ai-public-figure)
El input requiere prompt engineering. ej. Separar frases largas con puntos o puntos suspensivos (...), usar comas y espacios para indicar pausas, utilizar palabras en otros idiomas como sonarían en español (bai=bye, beibi=baby) y usar separaciones con (-) en pronunciaciones complejas (despipo-rró). """) with gr.Row(): text_input = gr.Textbox(label="Input Text",value="Hola soy Gustavo Petro y esta es mi voz de prueba",lines=1, placeholder="Hola soy Gustavo Petro y esta es mi voz de prueba") reduce_noise=gr.Checkbox(label="Reduce Noise", info="Use Noise Reduce after model generation?") text_button = gr.Button("Generate") text_button.click(text_to_speech, inputs=[text_input,reduce_noise], outputs=gr.Audio(label="Model Response")) logger.info("prompt: ",text_button) demo.launch()