computer-agent

Running on CPU Upgrade

App Files Files Community

m-ric commited on Mar 26

Commit

62a3d58

1 Parent(s): 052302c

Remove end of run errors, simplifies app.py by pruning elements

Browse files

Files changed (2) hide show

app.py +18 -56
e2bqwen.py +5 -2

app.py CHANGED Viewed

@@ -478,7 +478,7 @@ class EnrichedGradioUI(GradioUI):
             text_input,
             gr.Button(interactive=False),
         )
-    def interact_with_agent(self, task_input, messages, session_state, session_hash, request: gr.Request):
         import gradio as gr
         interaction_id = generate_interaction_id(request)
@@ -510,22 +510,20 @@ class EnrichedGradioUI(GradioUI):
         """)
         try:
-            messages.append(gr.ChatMessage(role="user", content=task_input))
-            yield messages
             for msg in stream_to_gradio(session_state["agent"], task=full_task, reset_agent_memory=False):
-                messages.append(msg)
-                yield messages
-            yield messages
             save_final_status(data_dir, "completed", details = str(session_state["agent"].memory.get_succinct_steps()))
         except Exception as e:
             error_message=f"Error in interaction: {str(e)}"
-            messages.append(gr.ChatMessage(role="assistant", content=error_message))
-            yield messages
             save_final_status(data_dir, "failed", details = str(error_message))
-            error_result = "Error running agent - Model inference endpoints not ready. Try again later." if 'Both endpoints failed' in error_message else "Error running agent"
-            yield gr.ChatMessage(role="assistant", content=error_result)
         finally:
             upload_to_hf_and_remove(data_dir)
@@ -577,20 +575,9 @@ with gr.Blocks(css=custom_css, js=custom_js, fill_width=True) as demo:
                 )
             update_btn = gr.Button("Let's go!", variant="primary")
-    # with gr.Group(visible=True) as terminal_container:
-        #terminal = gr.Textbox(
-        #    value="Initializing...",
-        #    label='Console',
-        #    lines=5,
-        #    max_lines=10,
-        #    interactive=False
-        #)
-    chatbot = gr.Chatbot(
         label="Agent's execution logs",
         type="messages",
         avatar_images=(
@@ -621,26 +608,15 @@ with gr.Blocks(css=custom_css, js=custom_js, fill_width=True) as demo:
                 return "".join(lines[-tail:] if len(lines) > tail else lines)
         except Exception as e:
             return f"Guru meditation: {str(e)}"
     # Function to set view-only mode
     def clear_and_set_view_only(task_input, request: gr.Request):
         # First clear the results, then set view-only mode
         return "", update_html(False, request), gr.update(visible=False)
-    # Function to set interactive mode
-    def set_interactive_mode(request: gr.Request):
         return update_html(True, request)
-    # Function to check result and conditionally set interactive mode
-    def check_and_set_interactive(result, request: gr.Request):
-        if result and not result.startswith("Error running agent"):
-            # Only set interactive mode if no error
-            return update_html(True, request)
-        else:
-            # Return the current HTML to avoid changing the display
-            # This will keep the BSOD visible
-            return gr.update()
     # Chain the events
     # 1. Set view-only mode when button is clicked and reset visibility
@@ -648,33 +624,19 @@ with gr.Blocks(css=custom_css, js=custom_js, fill_width=True) as demo:
         fn=clear_and_set_view_only,
         inputs=[task_input],
         outputs=[results_output, sandbox_html, results_container]
-    ).then(
-        agent_ui.log_user_message,
-        [task_input],
-        [stored_messages, task_input],
-    ).then(agent_ui.interact_with_agent, [stored_messages, chatbot, session_state, session_hash_state], [chatbot]).then(
-        lambda: (
-            gr.Textbox(
-                interactive=True, placeholder="Enter your prompt here and press Shift+Enter or the button"
-            ),
-            gr.Button(interactive=True),
-        ),
-        None,
-        [task_input],
-    ).then(
-        fn=check_and_set_interactive,
-        inputs=[results_output],
         outputs=sandbox_html
     )
     demo.load(
         fn=initialize_session,
         inputs=[gr.Checkbox(value=True, visible=False)],
         outputs=[sandbox_html, session_hash_state]
     )
-    # Connect refresh button to update terminal
 # Launch the app

             text_input,
             gr.Button(interactive=False),
         )
+    def interact_with_agent(self, task_input, stored_messages, session_state, session_hash, request: gr.Request):
         import gradio as gr
         interaction_id = generate_interaction_id(request)
         """)
         try:
+            stored_messages.append(gr.ChatMessage(role="user", content=task_input))
+            yield stored_messages
             for msg in stream_to_gradio(session_state["agent"], task=full_task, reset_agent_memory=False):
+                stored_messages.append(msg)
+                yield stored_messages
+            yield stored_messages
             save_final_status(data_dir, "completed", details = str(session_state["agent"].memory.get_succinct_steps()))
         except Exception as e:
             error_message=f"Error in interaction: {str(e)}"
+            stored_messages.append(gr.ChatMessage(role="assistant", content=error_message))
+            yield stored_messages
             save_final_status(data_dir, "failed", details = str(error_message))
         finally:
             upload_to_hf_and_remove(data_dir)
                 )
             update_btn = gr.Button("Let's go!", variant="primary")
+            cancel_btn = gr.Button("Interrupt running agent")
+    chatbot_display = gr.Chatbot(
         label="Agent's execution logs",
         type="messages",
         avatar_images=(
                 return "".join(lines[-tail:] if len(lines) > tail else lines)
         except Exception as e:
             return f"Guru meditation: {str(e)}"
     # Function to set view-only mode
     def clear_and_set_view_only(task_input, request: gr.Request):
         # First clear the results, then set view-only mode
         return "", update_html(False, request), gr.update(visible=False)
+    def set_interactive(request: gr.Request):
         return update_html(True, request)
     # Chain the events
     # 1. Set view-only mode when button is clicked and reset visibility
         fn=clear_and_set_view_only,
         inputs=[task_input],
         outputs=[results_output, sandbox_html, results_container]
+    )
+    view_only_event.then(agent_ui.interact_with_agent, [task_input, stored_messages, session_state, session_hash_state], [chatbot_display]).then(
+        fn=set_interactive,
+        inputs=[],
         outputs=sandbox_html
     )
+    cancel_btn.click(fn=(lambda x: x), cancels=[view_only_event])
     demo.load(
         fn=initialize_session,
         inputs=[gr.Checkbox(value=True, visible=False)],
         outputs=[sandbox_html, session_hash_state]
     )
 # Launch the app

e2bqwen.py CHANGED Viewed

@@ -330,6 +330,7 @@ class E2BVisionAgent(CodeAgent):
     def take_snapshot_callback(self, memory_step: ActionStep, agent=None) -> None:
         """Callback that takes a screenshot + memory snapshot after a step completes"""
         write_to_console_log(self.log_path, "Analyzing screen content...")
         current_step = memory_step.step_number
@@ -388,7 +389,7 @@ class QwenVLAPIModel(Model):
         model_path: str = "Qwen/Qwen2.5-VL-72B-Instruct",
         provider: str = "hyperbolic",
         hf_token: str = None,
-        hf_base_url: str = "https://n5wr7lfx6wp94tvl.us-east-1.aws.endpoints.huggingface.cloud/v1/"
     ):
         super().__init__()
         self.model_path = model_path
@@ -401,13 +402,15 @@ class QwenVLAPIModel(Model):
         self.hyperbolic_client = InferenceClient(
             provider=self.provider,
         )
         # Initialize HF OpenAI-compatible client if token is provided
         self.hf_client = None
         if hf_token:
             from openai import OpenAI
             self.hf_client = OpenAI(
-                base_url=self.hf_base_url,
                 api_key=self.hf_token
             )

     def take_snapshot_callback(self, memory_step: ActionStep, agent=None) -> None:
         """Callback that takes a screenshot + memory snapshot after a step completes"""
+        print("FYI, here is the system prompt:", agent.system_prompt)
         write_to_console_log(self.log_path, "Analyzing screen content...")
         current_step = memory_step.step_number
         model_path: str = "Qwen/Qwen2.5-VL-72B-Instruct",
         provider: str = "hyperbolic",
         hf_token: str = None,
+        hf_base_url: str = "https://n5wr7lfx6wp94tvl.us-east-1.aws.endpoints.huggingface.cloud"
     ):
         super().__init__()
         self.model_path = model_path
         self.hyperbolic_client = InferenceClient(
             provider=self.provider,
         )
+        assert not self.hf_base_url.endswith("/v1/"), "Enter your base url without '/v1/' suffix."
         # Initialize HF OpenAI-compatible client if token is provided
         self.hf_client = None
         if hf_token:
             from openai import OpenAI
             self.hf_client = OpenAI(
+                base_url=self.hf_base_url + "/v1/",
                 api_key=self.hf_token
             )