Spaces:

dtcxzyw
/

llvm-apr-benchmark-leaderboard

Runtime error

dtcxzyw commited on Jun 15

Commit

7a313bd

unverified ·

1 Parent(s): 913f726

show unique bugs

Files changed (1) hide show

app.py CHANGED Viewed

@@ -77,6 +77,7 @@ for cat, bug_ids in bug_id_by_cat.items():
         timeline_bugids.append(bug_id)
 LEADERBOARD_DF = get_leaderboard_df(EVAL_REQUESTS_PATH, total_issues)
 fixed_bug_ids = set()
 fixed_bug_ids_fast = set()
 for row in LEADERBOARD_DF.itertuples():
     print(row)
@@ -86,8 +87,10 @@ for row in LEADERBOARD_DF.itertuples():
         timeline_cols.append(row.method_id)
         timeline_bugids.append(fix)
         fixed_bug_ids.add(fix)
     for fix in row.fixed_bug_ids_fast:
         fixed_bug_ids_fast.add(fix)
 timeline_bugtypes = []
 for bug_id in timeline_bugids:
     timeline_xs.append(bug_id_to_time[bug_id])
@@ -148,6 +151,15 @@ fixed_by_comp_df = pd.DataFrame(
     }
 )
 fixed_by_comp_df.sort_values("Total", inplace=True, ascending=False)
 def init_leaderboard(dataframe):
@@ -192,6 +204,7 @@ with demo:
             )
             gr.Dataframe(fixed_by_cat_df)
             gr.Dataframe(fixed_by_comp_df)
         with gr.TabItem("🚀 Submission", elem_id="llm-benchmark-tab-table", id=1):
             gr.Markdown(EVALUATION_QUEUE_TEXT, elem_classes="markdown-text")

         timeline_bugids.append(bug_id)
 LEADERBOARD_DF = get_leaderboard_df(EVAL_REQUESTS_PATH, total_issues)
 fixed_bug_ids = set()
+fixed_bug_ids_count = dict()
 fixed_bug_ids_fast = set()
 for row in LEADERBOARD_DF.itertuples():
     print(row)
         timeline_cols.append(row.method_id)
         timeline_bugids.append(fix)
         fixed_bug_ids.add(fix)
+        fixed_bug_ids_count[fix] = fixed_bug_ids_count.get(fix, 0) + 1
     for fix in row.fixed_bug_ids_fast:
         fixed_bug_ids_fast.add(fix)
+unique_bug_ids = set([bug_id for bug_id, count in fixed_bug_ids_count.items() if count == 1])
 timeline_bugtypes = []
 for bug_id in timeline_bugids:
     timeline_xs.append(bug_id_to_time[bug_id])
     }
 )
 fixed_by_comp_df.sort_values("Total", inplace=True, ascending=False)
+unique_bugs_df = pd.DataFrame(
+    {
+        "Model": [c.method_id for c in LEADERBOARD_DF.itertuples()],
+        "Unique Bugs Fixed": [
+            len(set(c.fixed_bug_ids).intersection(unique_bug_ids)) for c in LEADERBOARD_DF.itertuples()
+        ],
+    }
+)
+unique_bugs_df.sort_values("Unique Bugs Fixed", inplace=True, ascending=False)
 def init_leaderboard(dataframe):
             )
             gr.Dataframe(fixed_by_cat_df)
             gr.Dataframe(fixed_by_comp_df)
+            gr.Dataframe(unique_bugs_df)
         with gr.TabItem("🚀 Submission", elem_id="llm-benchmark-tab-table", id=1):
             gr.Markdown(EVALUATION_QUEUE_TEXT, elem_classes="markdown-text")