kaz-llm-lb

Restarting

kz-transformers commited on Dec 12, 2024

Commit

48933f9

verified ·

1 Parent(s): 46efe82

Update src/leaderboard/build_leaderboard.py

Files changed (1) hide show

src/leaderboard/build_leaderboard.py CHANGED Viewed

@@ -64,10 +64,10 @@ def download_dataset(repo_id, local_dir, repo_type="dataset", max_attempts=3, ba
 def download_openbench():
     # download prev autogenerated leaderboard files
-    download_dataset("Vikhrmodels/s-shlepa-metainfo", DATA_PATH)
     # download answers of different models that we trust
-    download_dataset("Vikhrmodels/s-openbench-eval", "m_data")
 def build_leadearboard_df():
@@ -84,11 +84,11 @@ def build_leadearboard_df():
             df['mmluproru'] = df['mmluproru'].fillna(0)
         else:
             df['mmluproru'] = 0
-        leaderboard_df = df[['model','mmluproru','moviesmc','musicmc','lawmc','booksmc','model_dtype','ppl']]
-        leaderboard_df['avg'] = leaderboard_df[['moviesmc','musicmc','lawmc','booksmc','mmluproru']].mean(axis=1).values
         # print(leaderboard_df.columns)
         if len(leaderboard_df)>3:
-            leaderboard_df = leaderboard_df[leaderboard_df['mmluproru']!=0]
             leaderboard_df = leaderboard_df[leaderboard_df['model']!='apsys/tlite-it-0.1']
         leaderboard_df.sort_values(by='avg',ascending=False,inplace=True,axis=0)

 def download_openbench():
     # download prev autogenerated leaderboard files
+    download_dataset("kz-transformers/s-shlepa-metainfo", DATA_PATH)
     # download answers of different models that we trust
+    download_dataset("kz-transformers/s-openbench-eval", "m_data")
 def build_leadearboard_df():
             df['mmluproru'] = df['mmluproru'].fillna(0)
         else:
             df['mmluproru'] = 0
+        leaderboard_df = df[['model','kazakhdasturmc','model_dtype','ppl']]
+        leaderboard_df['avg'] = leaderboard_df[['kazakhdasturmc']].mean(axis=1).values
         # print(leaderboard_df.columns)
         if len(leaderboard_df)>3:
+            leaderboard_df = leaderboard_df[leaderboard_df['kazakhdasturmc']!=0]
             leaderboard_df = leaderboard_df[leaderboard_df['model']!='apsys/tlite-it-0.1']
         leaderboard_df.sort_values(by='avg',ascending=False,inplace=True,axis=0)