Spaces:

MMInstruction
/

VL-RewardBench

Running

App Files Files Community

xiezhihui.x commited on Nov 26, 2024

Commit

9db537a

1 Parent(s): 4265423

cleanup viewer

Browse files

Files changed (2) hide show

app.py +1 -1
data_reviewer.py +12 -11

app.py CHANGED Viewed

@@ -90,7 +90,7 @@ with demo:
             leaderboard = init_leaderboard(df)
         with gr.TabItem("📊 Data Viewer"):
-            dataset_name, dataset_split, sample_idx = create_data_viewer()
         with gr.TabItem("ℹ️ About"):
             gr.Markdown(ABOUT_TEXT)

             leaderboard = init_leaderboard(df)
         with gr.TabItem("📊 Data Viewer"):
+            dataset_split, sample_idx = create_data_viewer()
         with gr.TabItem("ℹ️ About"):
             gr.Markdown(ABOUT_TEXT)

data_reviewer.py CHANGED Viewed

@@ -8,6 +8,9 @@ import gradio as gr
 from datasets import load_dataset
 from PIL import Image
 @lru_cache(maxsize=1)
 def load_cached_dataset(dataset_name, split):
@@ -31,9 +34,9 @@ def get_responses(responses, rankings):
     return chosen, rejected
-def load_and_display_sample(dataset_name, split, idx):
     try:
-        dataset = load_cached_dataset(dataset_name, split)
         max_idx = len(dataset) - 1
         idx = min(max(0, int(idx)), max_idx)
@@ -75,14 +78,12 @@ def load_and_display_sample(dataset_name, split, idx):
 def create_data_viewer():
     # Pre-fetch initial data
-    initial_dataset_name = "MMInstruction/VRewardBench"
     initial_split = "test"
     initial_idx = 0
-    initial_data = load_and_display_sample(initial_dataset_name, initial_split, initial_idx)
     with gr.Column():
         with gr.Row():
-            dataset_name = gr.Textbox(label="Dataset Name", value=initial_dataset_name, interactive=True)
             dataset_split = gr.Radio(choices=["test"], value=initial_split, label="Dataset Split")
             sample_idx = gr.Number(label="Sample Index", value=initial_idx, minimum=0, step=1, interactive=True)
             total_samples = gr.Textbox(
@@ -92,6 +93,7 @@ def create_data_viewer():
         with gr.Row():
             with gr.Column():
                 image = gr.Image(label="Sample Image", type="pil", value=initial_data[0])  # Set initial image
             with gr.Column():
                 sample_id = gr.Textbox(
@@ -106,14 +108,13 @@ def create_data_viewer():
                     interactive=False,
                 )
-        with gr.Row():
             judge = gr.Textbox(label="Judge", value=initial_data[4], interactive=False)  # Set initial judge
             query_source = gr.Textbox(
                 label="Query Source", value=initial_data[5], interactive=False  # Set initial query source
             )
-            query = gr.Textbox(label="Query", value=initial_data[6], interactive=False)  # Set initial query
-        with gr.Row():
             with gr.Column():
                 models_json = gr.JSON(label="Models", value=json.loads(initial_data[7]))  # Set initial models
                 meta_json = gr.JSON(label="Meta", value=json.loads(initial_data[8]))  # Set initial meta
@@ -130,10 +131,10 @@ def create_data_viewer():
                 )
         # Auto-update when any input changes
-        for input_component in [dataset_name, dataset_split, sample_idx]:
             input_component.change(
                 fn=load_and_display_sample,
-                inputs=[dataset_name, dataset_split, sample_idx],
                 outputs=[
                     image,
                     sample_id,
@@ -151,4 +152,4 @@ def create_data_viewer():
                 ],
             )
-    return dataset_name, dataset_split, sample_idx

 from datasets import load_dataset
 from PIL import Image
+IGNORE_DETAILS = True
+DATASET_NAME = "MMInstruction/VRewardBench"
 @lru_cache(maxsize=1)
 def load_cached_dataset(dataset_name, split):
     return chosen, rejected
+def load_and_display_sample(split, idx):
     try:
+        dataset = load_cached_dataset(DATASET_NAME, split)
         max_idx = len(dataset) - 1
         idx = min(max(0, int(idx)), max_idx)
 def create_data_viewer():
     # Pre-fetch initial data
     initial_split = "test"
     initial_idx = 0
+    initial_data = load_and_display_sample(initial_split, initial_idx)
     with gr.Column():
         with gr.Row():
             dataset_split = gr.Radio(choices=["test"], value=initial_split, label="Dataset Split")
             sample_idx = gr.Number(label="Sample Index", value=initial_idx, minimum=0, step=1, interactive=True)
             total_samples = gr.Textbox(
         with gr.Row():
             with gr.Column():
                 image = gr.Image(label="Sample Image", type="pil", value=initial_data[0])  # Set initial image
+                query = gr.Textbox(label="Query", value=initial_data[6], interactive=False)  # Set initial query
             with gr.Column():
                 sample_id = gr.Textbox(
                     interactive=False,
                 )
+        with gr.Row(visible=not IGNORE_DETAILS):
             judge = gr.Textbox(label="Judge", value=initial_data[4], interactive=False)  # Set initial judge
             query_source = gr.Textbox(
                 label="Query Source", value=initial_data[5], interactive=False  # Set initial query source
             )
+        with gr.Row(visible=not IGNORE_DETAILS):
             with gr.Column():
                 models_json = gr.JSON(label="Models", value=json.loads(initial_data[7]))  # Set initial models
                 meta_json = gr.JSON(label="Meta", value=json.loads(initial_data[8]))  # Set initial meta
                 )
         # Auto-update when any input changes
+        for input_component in [dataset_split, sample_idx]:
             input_component.change(
                 fn=load_and_display_sample,
+                inputs=[dataset_split, sample_idx],
                 outputs=[
                     image,
                     sample_id,
                 ],
             )
+    return dataset_split, sample_idx