Spaces:

JMAA00
/

Testllama8b

Sleeping

App Files Files Community

JMAA00 commited on Mar 30

Commit

726dd3c

1 Parent(s): adc63f0

VFinal-v1

Browse files

Files changed (1) hide show

app.py +16 -43

app.py CHANGED Viewed

@@ -15,18 +15,12 @@ https://huggingface.co/docs/huggingface_hub/v0.22.2/en/guides/inference
 SERPER_API_KEY = os.getenv("SERPER_API_KEY")
 def do_websearch(query: str) -> str:
-    """
-    Llama a serper.dev para hacer la búsqueda en Google y devolver
-    un texto resumido de los resultados.
-    """
     if not SERPER_API_KEY:
         return "(SERPER_API_KEY no está configurado)"
     url = "https://google.serper.dev/search"
-    headers = {
-        "X-API-KEY": SERPER_API_KEY,
-        "Content-Type": "application/json",
-    }
     payload = {"q": query}
     try:
@@ -35,7 +29,6 @@ def do_websearch(query: str) -> str:
     except Exception as e:
         return f"(Error al llamar a serper.dev: {e})"
-    # Se espera un campo 'organic' con resultados
     if "organic" not in data:
         return "No se encontraron resultados en serper.dev."
@@ -51,17 +44,13 @@ def do_websearch(query: str) -> str:
     return "\n".join(text)
 # ----------------------------------------------------------------
 # CONFIGURACIÓN DEL MODELO (AHORA CON TOKEN)
 # ----------------------------------------------------------------
-# Cargamos el token desde la variable de entorno 'HF_API_TOKEN'
 hf_api_token = os.getenv("HF_API_TOKEN")
-# Usamos el modelo meta-llama/Llama-3.1-8B-Instruct con acceso a tu cuenta
 client = InferenceClient(
     model="meta-llama/Llama-3.1-8B-Instruct",
-    token=hf_api_token  # <-- la clave para evitar el 401 Unauthorized
 )
 def respond(
@@ -71,7 +60,7 @@ def respond(
     max_tokens,
     temperature,
     top_p,
-    use_search  # <-- Nuevo parámetro: si está "activado" el botón
 ):
     """
     - system_message: Texto del rol "system"
@@ -80,14 +69,12 @@ def respond(
     - use_search: booleano que indica si se habilita la búsqueda en serper
     """
-    # (1) Solo se llama a la websearch si use_search está activo
-    # (2) Se mezclan los resultados en primer lugar + el mensaje del usuario en segundo lugar
     if use_search:
         web_info = do_websearch(message)
-        # "En primer lugar el resultado del scraper y luego el input del usuario"
         message = f"Información de la web:\n{web_info}\n\nPregunta del usuario:\n{message}"
-    # Construimos la lista de mensajes
     messages = [{"role": "system", "content": system_message}]
     for user_txt, assistant_txt in history:
         if user_txt:
@@ -95,7 +82,7 @@ def respond(
         if assistant_txt:
             messages.append({"role": "assistant", "content": assistant_txt})
-    # Añadimos el nuevo turno del usuario
     messages.append({"role": "user", "content": message})
     # Llamamos a la API con streaming
@@ -103,36 +90,27 @@ def respond(
     for chunk in client.chat_completion(
         messages=messages,
         max_tokens=max_tokens,
-        stream=True,
         temperature=temperature,
         top_p=top_p,
     ):
         token = chunk.choices[0].delta.get("content", "")
         response_text += token
         yield response_text
 # ----------------------------------------------------------------
 # CONFIGURACIÓN DE LA INTERFAZ
 # ----------------------------------------------------------------
-# Ejemplo de Tailwind classes (puedes personalizarlas):
-tailwind_toggle_classes = [
-    "inline-flex",
-    "items-center",
-    "bg-blue-500",
-    "hover:bg-blue-700",
-    "text-white",
-    "font-bold",
-    "py-1",
-    "px-2",
-    "rounded",
-    "cursor-pointer"
-]
-# ChatInterface, con un input Checkbox para "🌐 Búsqueda"
 demo = gr.ChatInterface(
     fn=respond,
     additional_inputs=[
         gr.Textbox(
             value=(
                 "Eres Juan, un asistente virtual en español. "
@@ -143,6 +121,7 @@ demo = gr.ChatInterface(
             ),
             label="Mensaje del sistema",
         ),
         gr.Slider(
             minimum=1,
             maximum=2048,
@@ -164,12 +143,6 @@ demo = gr.ChatInterface(
             step=0.05,
             label="Top-p (muestreo por núcleo)",
         ),
-        # Un checkbox para habilitar "búsqueda web" (use_search)
-        gr.Checkbox(
-            value=False,
-            label="🌐 Búsqueda",
-            elem_classes=tailwind_toggle_classes
-        ),
     ],
 )

 SERPER_API_KEY = os.getenv("SERPER_API_KEY")
 def do_websearch(query: str) -> str:
+    """ Llama a serper.dev para hacer la búsqueda en Google y devuelve texto. """
     if not SERPER_API_KEY:
         return "(SERPER_API_KEY no está configurado)"
     url = "https://google.serper.dev/search"
+    headers = {"X-API-KEY": SERPER_API_KEY, "Content-Type": "application/json"}
     payload = {"q": query}
     try:
     except Exception as e:
         return f"(Error al llamar a serper.dev: {e})"
     if "organic" not in data:
         return "No se encontraron resultados en serper.dev."
     return "\n".join(text)
 # ----------------------------------------------------------------
 # CONFIGURACIÓN DEL MODELO (AHORA CON TOKEN)
 # ----------------------------------------------------------------
 hf_api_token = os.getenv("HF_API_TOKEN")
 client = InferenceClient(
     model="meta-llama/Llama-3.1-8B-Instruct",
+    token=hf_api_token
 )
 def respond(
     max_tokens,
     temperature,
     top_p,
+    use_search  # <-- Checkbox en 1er lugar en additional_inputs
 ):
     """
     - system_message: Texto del rol "system"
     - use_search: booleano que indica si se habilita la búsqueda en serper
     """
+    # Si use_search es True, primero el contenido web y luego el input
     if use_search:
         web_info = do_websearch(message)
         message = f"Información de la web:\n{web_info}\n\nPregunta del usuario:\n{message}"
+    # Construimos la conversación
     messages = [{"role": "system", "content": system_message}]
     for user_txt, assistant_txt in history:
         if user_txt:
         if assistant_txt:
             messages.append({"role": "assistant", "content": assistant_txt})
+    # Añadimos turno nuevo
     messages.append({"role": "user", "content": message})
     # Llamamos a la API con streaming
     for chunk in client.chat_completion(
         messages=messages,
         max_tokens=max_tokens,
         temperature=temperature,
         top_p=top_p,
+        stream=True
     ):
         token = chunk.choices[0].delta.get("content", "")
         response_text += token
         yield response_text
 # ----------------------------------------------------------------
 # CONFIGURACIÓN DE LA INTERFAZ
 # ----------------------------------------------------------------
+# Subimos la casilla de verificación (checkbox) de websearch a la parte superior
 demo = gr.ChatInterface(
     fn=respond,
     additional_inputs=[
+        # 1) Checkbox de websearch
+        gr.Checkbox(
+            value=False,
+            label="🌐 Búsqueda",
+        ),
+        # 2) Texto system
         gr.Textbox(
             value=(
                 "Eres Juan, un asistente virtual en español. "
             ),
             label="Mensaje del sistema",
         ),
+        # 3) Sliders
         gr.Slider(
             minimum=1,
             maximum=2048,
             step=0.05,
             label="Top-p (muestreo por núcleo)",
         ),
     ],
 )