Spaces:

embedding-benchmark
/

RTEB

Running

App Files Files Community

handling_the_model_alias_field

by fzoll - opened 25 days ago

base: refs/heads/main

←

from: refs/pr/6

Discussion Files changed

+22

-2

Files changed (1) hide show

app/backend/data_engine.py +22 -2

app/backend/data_engine.py CHANGED Viewed

@@ -20,7 +20,8 @@ COLUMNS_TYPES = ["markdown",
                  ]
-GIT_URL = "https://raw.githubusercontent.com/embedding-benchmark/rteb/refs/heads/main/results/"
 DATASET_URL = f"{GIT_URL}datasets.json"
 MODEL_URL = f"{GIT_URL}models.json"
 RESULT_URL = f"{GIT_URL}results.json"
@@ -104,6 +105,25 @@ class DataEngine:
         df_model = pd.DataFrame(models_list)
         df = pd.merge(df_result, df_dataset, on=["dataset_name"], how="inner")
         # set dataset default value to 0
@@ -132,7 +152,7 @@ class DataEngine:
         pivot_dataset = df_result.pivot(index=["model_name", "embd_dim", "embd_dtype"], columns="dataset_name", values="ndcg_at_10").fillna(0)
-        df = pd.merge(df_model, pivot, on=["model_name", "embd_dim", "embd_dtype"])
         df = pd.merge(df, pivot_dataset, on=["model_name", "embd_dim", "embd_dtype"])
         if df.empty:

                  ]
+BRANCH = 'main'
+GIT_URL = f"https://raw.githubusercontent.com/embedding-benchmark/rteb/refs/heads/{BRANCH}/results/"
 DATASET_URL = f"{GIT_URL}datasets.json"
 MODEL_URL = f"{GIT_URL}models.json"
 RESULT_URL = f"{GIT_URL}results.json"
         df_model = pd.DataFrame(models_list)
+        # Create mapping for model names/aliases
+        if 'alias' in df_model.columns:
+            # Create a lookup table for alias to model_name mapping
+            alias_mapping = df_model[df_model['alias'].notna()].set_index('alias')['model_name'].to_dict()
+            # Add rows for aliases to enable joining
+            alias_rows = []
+            for _, row in df_model[df_model['alias'].notna()].iterrows():
+                alias_row = row.copy()
+                alias_row['model_name'] = row['alias']
+                alias_rows.append(alias_row)
+            if alias_rows:
+                df_model_extended = pd.concat([df_model, pd.DataFrame(alias_rows)], ignore_index=True)
+            else:
+                df_model_extended = df_model
+        else:
+            df_model_extended = df_model
         df = pd.merge(df_result, df_dataset, on=["dataset_name"], how="inner")
         # set dataset default value to 0
         pivot_dataset = df_result.pivot(index=["model_name", "embd_dim", "embd_dtype"], columns="dataset_name", values="ndcg_at_10").fillna(0)
+        df = pd.merge(df_model_extended, pivot, on=["model_name", "embd_dim", "embd_dtype"])
         df = pd.merge(df, pivot_dataset, on=["model_name", "embd_dim", "embd_dtype"])
         if df.empty: