Spaces:

alex16052G
/

abi

Paused

alex16052G commited on Jan 22

Commit

008d463

verified ·

1 Parent(s): 6cca346

Create app.py

Files changed (1) hide show

app.py ADDED Viewed

+import gradio as gr
+from transformers import AutoModelForCausalLM, AutoTokenizer
+from f5_infer import F5TTS
+# Cargar el modelo Qwen2.5-3B-Instruct
+tokenizer = AutoTokenizer.from_pretrained("Qwen/Qwen-2.5B-Instruct")
+model = AutoModelForCausalLM.from_pretrained("Qwen/Qwen-2.5B-Instruct", device_map="auto")
+# Inicializar Spanish-F5 para síntesis de voz
+tts = F5TTS()
+# Función principal para el flujo del chat con voz
+def chat_with_voice(input_text):
+    # Generar respuesta con Qwen
+    inputs = tokenizer(input_text, return_tensors="pt").to("cuda")
+    outputs = model.generate(**inputs, max_length=200)
+    response_text = tokenizer.decode(outputs[0], skip_special_tokens=True)
+    # Convertir respuesta a audio usando Spanish-F5
+    audio_path = tts.generate_tts(response_text, output_path="response.wav")
+    return response_text, audio_path
+# Interfaz de Gradio
+with gr.Blocks() as demo:
+    gr.Markdown("# Chat AI con Voz (Qwen y Spanish-F5)")
+    with gr.Row():
+        input_text = gr.Textbox(label="Escribe tu mensaje:", placeholder="¿Cómo puedo ayudarte hoy?")
+    with gr.Row():
+        response_text = gr.Textbox(label="Respuesta del modelo")
+        response_audio = gr.Audio(label="Respuesta en voz", type="filepath")
+    send_btn = gr.Button("Enviar")
+    # Conectar eventos
+    send_btn.click(chat_with_voice, inputs=input_text, outputs=[response_text, response_audio])
+# Ejecutar la app
+demo.launch()