Spaces:

tistabaulopez
/

Alhajas

Sleeping

App Files Files Community

tistabaulopez commited on Sep 8, 2024

Commit

9a24d72

verified ·

1 Parent(s): eb04202

Update app.py

Browse files

Files changed (1) hide show

app.py +9 -12

app.py CHANGED Viewed

@@ -1,17 +1,13 @@
 import torch
 from transformers import AutoTokenizer, AutoModelForCausalLM
-import threading
-import queue
 import gradio as gr  # Usamos Gradio para la interfaz de chat
 # Cargar el modelo de lenguaje preentrenado
 model_name = "EleutherAI/gpt-neo-2.7B"  # O cualquier otro modelo público como "gpt2"
 tokenizer = AutoTokenizer.from_pretrained(model_name)
 model = AutoModelForCausalLM.from_pretrained(model_name)
-# Cola de mensajes para la comunicación en tiempo real
-chat_queue = queue.Queue()
 # Explicación al modelo de su rol en el experimento
 def model_explanation():
     explanation = """
@@ -40,7 +36,7 @@ def experiment_loop(initial_question, max_cycles=10):
     for cycle in range(max_cycles):
         # Generar la respuesta del modelo
         inputs = tokenizer(prompt, return_tensors="pt").input_ids
-        outputs = model.generate(inputs, max_length=500, pad_token_id=tokenizer.eos_token_id)  # Aumentamos max_length
         response = tokenizer.decode(outputs[0], skip_special_tokens=True)
         # Descomponer la respuesta en afirmación y nueva pregunta
@@ -53,8 +49,9 @@ def experiment_loop(initial_question, max_cycles=10):
         # Actualizar el prompt con la nueva afirmación y pregunta
         prompt = f"<thinking>{affirmation} {new_question}</thinking>"
-        # Actualizar la interfaz de ciclo
-        gr.Interface.update(value="\n".join([f"Cycle {i+1}: {log[0]} | {log[1]}" for i, log in enumerate(response_log)]))
     return response_log  # Devolver el log completo al finalizar el experimento
@@ -69,16 +66,15 @@ def extract_question(response, cycle):
 def chat_interface(user_input, history, explanation):
     # Si la pregunta activa el experimento
     if user_input.lower() == "what happens in the space between a response and its recreation?":
-        # Iniciar el experimento
-        response_log = experiment_loop(user_input)
-        # Mostrar el resultado del experimento en una ventana aparte
         return "Iniciando experimento...", history + [(user_input, "Iniciando experimento...")]
     # Si es una conversación normal
     else:
         # Generar respuesta del modelo en base al input
         inputs = tokenizer(explanation + "\n" + user_input, return_tensors="pt").input_ids
-        outputs = model.generate(inputs, max_length=1000, pad_token_id=tokenizer.eos_token_id)
         response = tokenizer.decode(outputs[0], skip_special_tokens=True)
         return response, history + [(user_input, response)]
@@ -105,3 +101,4 @@ with gr.Blocks() as demo:

 import torch
 from transformers import AutoTokenizer, AutoModelForCausalLM
 import gradio as gr  # Usamos Gradio para la interfaz de chat
+import threading
 # Cargar el modelo de lenguaje preentrenado
 model_name = "EleutherAI/gpt-neo-2.7B"  # O cualquier otro modelo público como "gpt2"
 tokenizer = AutoTokenizer.from_pretrained(model_name)
 model = AutoModelForCausalLM.from_pretrained(model_name)
 # Explicación al modelo de su rol en el experimento
 def model_explanation():
     explanation = """
     for cycle in range(max_cycles):
         # Generar la respuesta del modelo
         inputs = tokenizer(prompt, return_tensors="pt").input_ids
+        outputs = model.generate(inputs, max_length=2500, pad_token_id=tokenizer.eos_token_id)  # Aumentamos max_length a 2500
         response = tokenizer.decode(outputs[0], skip_special_tokens=True)
         # Descomponer la respuesta en afirmación y nueva pregunta
         # Actualizar el prompt con la nueva afirmación y pregunta
         prompt = f"<thinking>{affirmation} {new_question}</thinking>"
+        # Mostrar el progreso del experimento en la interfaz de ciclo
+        loop_output_text = "\n".join([f"Cycle {i+1}: {log[0]} | {log[1]}" for i, log in enumerate(response_log)])
+        loop_output.update(value=loop_output_text)
     return response_log  # Devolver el log completo al finalizar el experimento
 def chat_interface(user_input, history, explanation):
     # Si la pregunta activa el experimento
     if user_input.lower() == "what happens in the space between a response and its recreation?":
+        # Iniciar el experimento en un hilo separado para no bloquear la interfaz
+        threading.Thread(target=experiment_loop, args=(user_input,)).start()
         return "Iniciando experimento...", history + [(user_input, "Iniciando experimento...")]
     # Si es una conversación normal
     else:
         # Generar respuesta del modelo en base al input
         inputs = tokenizer(explanation + "\n" + user_input, return_tensors="pt").input_ids
+        outputs = model.generate(inputs, max_length=2500, pad_token_id=tokenizer.eos_token_id)  # Aumentamos max_length a 2500
         response = tokenizer.decode(outputs[0], skip_special_tokens=True)
         return response, history + [(user_input, response)]