Spaces:

root-signals
/

CustomJudgeDemo

Running

App Files Files Community

Ouz commited on Feb 19

Commit

d3e0b87

1 Parent(s): e984be7

Add better popups

Browse files

Files changed (1) hide show

app.py +24 -16

app.py CHANGED Viewed

@@ -22,31 +22,38 @@ MODELS = [
     "o1-mini",
     "o1-preview",
     "open-codestral-mamba",
 ]
 def initialize_client(api_key):
     global client
     return RootSignals(api_key=api_key)
-def create_judge(api_key, judge_name, intent, judge_prompt):
     global client, custom_judge
     if not client:
         client = initialize_client(api_key)
     # Create custom judge
     custom_judge = client.evaluators.create(
         name=judge_name,
-        predicate=judge_prompt + " {{output}}",
-        intent=intent,
-        model="gpt-4o",
     )
-    return gr.Info(f"Custom LLM-Judge '{judge_name}' is created successfully!")
-def evaluate_response(llm_response):
     global client, custom_judge
     if not client or not custom_judge:
-        return "Please create a judge first", "Please create a judge first"
     # Run evaluation using custom judge
     evaluation_result = custom_judge.run(response=llm_response)
@@ -76,14 +83,14 @@ with gr.Blocks(theme=gr.themes.Default(primary_hue="blue")) as demo:
     gr.Markdown("---")  # Divider
-    gr.Markdown("### Create Custom Judge")
     with gr.Row():
-        judge_name = gr.Textbox(label="👨‍⚖️ Judge Name", placeholder="Enter a name for your custom judge...", interactive=True)
-        user_intent = gr.Textbox(label="👤 Intent", placeholder="Enter the high-level intent for this judge...", interactive=True)
     with gr.Row():
         judge_prompt = gr.Textbox(
             label="📝 Custom Judge Prompt",
             placeholder="Enter the custom judge prompt...",
             interactive=True,
             lines=5,
             max_lines=10
@@ -96,10 +103,11 @@ with gr.Blocks(theme=gr.themes.Default(primary_hue="blue")) as demo:
     with gr.Row():
         # Left column - Evaluation
         with gr.Column():
-            gr.Markdown("### Evaluate Response")
             llm_response = gr.Textbox(
                 label="🤖 LLM Response",
-                placeholder="Enter the LLM response to be evaluated...",
                 interactive=True,
                 lines=5,
                 max_lines=10
@@ -108,24 +116,24 @@ with gr.Blocks(theme=gr.themes.Default(primary_hue="blue")) as demo:
         # Right column - Results
         with gr.Column():
-            gr.Markdown("### Results")
             score = gr.Textbox(label="📊 Score (between 0 and 1)", interactive=False)
             justification = gr.TextArea(label="💬 Justification", interactive=False)
     # Button click events
     create_judge_btn.click(
         fn=create_judge,
-        inputs=[api_key, judge_name, user_intent, judge_prompt],
         outputs=info_message
     )
     evaluate_btn.click(
         fn=evaluate_response,
-        inputs=[llm_response],
         outputs=[score, justification]
     )
-    gr.Markdown("[Homepage](https://www.rootsignals.ai/) | [Python SDK Docs](https://sdk.rootsignals.ai/en/latest/)")
 if __name__ == "__main__":
     demo.launch()

     "o1-mini",
     "o1-preview",
     "open-codestral-mamba",
+    "RootJudge",
 ]
 def initialize_client(api_key):
     global client
     return RootSignals(api_key=api_key)
+def create_judge(api_key, judge_name, judge_prompt):
     global client, custom_judge
+    if not api_key:
+        return gr.Info("🔑 Please enter your Root Signals API key first!")
     if not client:
         client = initialize_client(api_key)
     # Create custom judge
     custom_judge = client.evaluators.create(
         name=judge_name,
+        predicate=f'{judge_prompt}\n\nTEXT: {{{{response}}}}',
+        intent=f"Intent: {judge_name}",
+        model="gemini-2.0-flash",
     )
+    return gr.Info(f"Your custom LLM-Judge '{judge_name}' is created successfully!")
+def evaluate_response(api_key, llm_response):
     global client, custom_judge
+    if not api_key:
+        return gr.Info("🔑 Please enter your Root Signals API key first!"), ""
     if not client or not custom_judge:
+        return gr.Info("Please create a judge first"), ""
     # Run evaluation using custom judge
     evaluation_result = custom_judge.run(response=llm_response)
     gr.Markdown("---")  # Divider
+    gr.Markdown("## Create Custom Judge")
     with gr.Row():
+        judge_name = gr.Textbox(label="👨‍⚖️ Judge Name", value="Medical Jargon Judge", placeholder="Enter a name for your custom judge...", interactive=True)
     with gr.Row():
         judge_prompt = gr.Textbox(
             label="📝 Custom Judge Prompt",
             placeholder="Enter the custom judge prompt...",
+            value="Evaluate the medical jargon use of a text. Higher scores mean the text include a lot of technical jargon such as drug names and very specific medical terminology.",
             interactive=True,
             lines=5,
             max_lines=10
     with gr.Row():
         # Left column - Evaluation
         with gr.Column():
+            gr.Markdown("## Execute")
             llm_response = gr.Textbox(
                 label="🤖 LLM Response",
+                placeholder="Enter the LLM response to be evaluated...",
+                value="This CCR5 co-receptor is used by almost all primary HIV-1 isolates regardless of viral genetic subtype.",
                 interactive=True,
                 lines=5,
                 max_lines=10
         # Right column - Results
         with gr.Column():
+            gr.Markdown("## Results")
             score = gr.Textbox(label="📊 Score (between 0 and 1)", interactive=False)
             justification = gr.TextArea(label="💬 Justification", interactive=False)
     # Button click events
     create_judge_btn.click(
         fn=create_judge,
+        inputs=[api_key, judge_name, judge_prompt],
         outputs=info_message
     )
     evaluate_btn.click(
         fn=evaluate_response,
+        inputs=[api_key, llm_response],
         outputs=[score, justification]
     )
+    gr.Markdown("[🌐 Homepage](https://www.rootsignals.ai/) | [🤖 Github Repo](https://sdk.rootsignals.ai/en/latest/) | [🐍 Python SDK Docs](https://sdk.rootsignals.ai/en/latest/) | [💬 Discord](https://discord.gg/EhazTQsFnj)")
 if __name__ == "__main__":
     demo.launch()