Spaces:

C2MV
/

BioRAG

Sleeping

C2MV commited on Sep 27, 2024

Commit

820a0dd

verified ·

1 Parent(s): 5a798cc

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,6 +1,20 @@
 import gradio as gr
 import torch
 from transformers import AutoModelForCausalLM, AutoTokenizer
 # Verificar si CUDA está disponible
 device = "cuda" if torch.cuda.is_available() else "cpu"
@@ -16,6 +30,7 @@ model = AutoModelForCausalLM.from_pretrained(
     torch_dtype=torch.float16 if device == "cuda" else torch.float32
 ).to(device)
 def generar_respuesta(consulta):
     """
     Función que genera una respuesta a partir de una consulta dada.
@@ -25,7 +40,7 @@ def generar_respuesta(consulta):
     # Configurar los parámetros de generación
     generation_kwargs = {
-        "max_new_tokens": 200,
         "temperature": 0.0,
         "top_p": 1.0,
         "do_sample": False,

 import gradio as gr
 import torch
 from transformers import AutoModelForCausalLM, AutoTokenizer
+import time
+from functools import wraps
+# Decorador para medir el tiempo de ejecución
+def medir_tiempo(func):
+    @wraps(func)
+    def wrapper(*args, **kwargs):
+        inicio = time.time()
+        resultado = func(*args, **kwargs)
+        fin = time.time()
+        tiempo_transcurrido = fin - inicio
+        print(f"Tiempo de ejecución de '{func.__name__}': {tiempo_transcurrido:.2f} segundos")
+        return resultado
+    return wrapper
 # Verificar si CUDA está disponible
 device = "cuda" if torch.cuda.is_available() else "cpu"
     torch_dtype=torch.float16 if device == "cuda" else torch.float32
 ).to(device)
+@medir_tiempo
 def generar_respuesta(consulta):
     """
     Función que genera una respuesta a partir de una consulta dada.
     # Configurar los parámetros de generación
     generation_kwargs = {
+        "max_new_tokens": 100,  # Ajustado a 100
         "temperature": 0.0,
         "top_p": 1.0,
         "do_sample": False,