Spaces:

GAS17
/

v2

Sleeping

App Files Files Community

GAS17 commited on Jun 17

Commit

21989cb

verified ·

1 Parent(s): 38a6871

Create app.py

Browse files

Files changed (1) hide show

app.py +87 -0

app.py ADDED Viewed

	@@ -0,0 +1,87 @@

+import gradio as gr
+import requests
+import os
+from dotenv import load_dotenv
+from datetime import datetime, timedelta
+# Cargar variables de entorno desde el archivo .env
+load_dotenv()
+# Constantes para el script
+CHUNK_SIZE = 1024  # Tamaño de los chunks para leer/escribir a la vez
+XI_API_KEY = os.getenv("XI_API_KEY")  # Tu clave API para autenticación
+VOICE_ID = os.getenv("VOICE_ID")      # ID del modelo de voz a utilizar
+# Diccionario para almacenar la información de uso
+usage_data = {
+    'message_count': 0,
+    'last_reset': datetime.now()
+}
+# Configuración de límites
+MESSAGE_LIMIT = 145
+TIME_LIMIT = timedelta(hours=2)
+def text_to_speech(text, style):
+    global usage_data
+    current_time = datetime.now()
+    # Resetear el contador si ha pasado el tiempo límite
+    if current_time - usage_data['last_reset'] > TIME_LIMIT:
+        usage_data = {
+            'message_count': 0,
+            'last_reset': current_time
+        }
+    # Verificar si se ha alcanzado el límite de mensajes
+    if usage_data['message_count'] >= MESSAGE_LIMIT:
+        return None  # Limite alcanzado, no se produce audio
+    # URL para la solicitud de la API de Text-to-Speech
+    tts_url = f"https://api.elevenlabs.io/v1/text-to-speech/{VOICE_ID}/stream"
+    # Encabezados para la solicitud de la API
+    headers = {
+        "Accept": "application/json",
+        "xi-api-key": XI_API_KEY
+    }
+    # Datos de carga útil para la solicitud de la API
+    data = {
+        "text": text,
+        "model_id": "eleven_multilingual_v2",
+        "voice_settings": {
+            "stability": 0.5,
+            "similarity_boost": 0.8,
+            "style": style,
+            "use_speaker_boost": True
+        }
+    }
+    # Realizar la solicitud POST
+    response = requests.post(tts_url, headers=headers, json=data, stream=True)
+    # Verificar si la solicitud fue exitosa
+    if response.ok:
+        output_path = "output.mp3"
+        with open(output_path, "wb") as f:
+            for chunk in response.iter_content(chunk_size=CHUNK_SIZE):
+                f.write(chunk)
+        usage_data['message_count'] += 1
+        return output_path
+    else:
+        return None  # Si falla, tampoco generes audio
+iface = gr.Interface(
+    fn=text_to_speech,
+    inputs=[
+        gr.Textbox(label="Texto"),
+        gr.Slider(minimum=0, maximum=1, step=0.1, label="Style")
+    ],
+    outputs=gr.Audio(type="filepath"),
+    title="Text to Speech ElevenLabs",
+    description="Convierte texto a voz usando ElevenLabs. Elige el 'Style' con el slider."
+)
+if __name__ == "__main__":
+    iface.launch(share=True)