eval-leaderboard

Running

xeon27 commited on Jan 31

Commit

64ec699

1 Parent(s): 51b158d

Fix bug

Files changed (1) hide show

src/populate.py CHANGED Viewed

@@ -9,6 +9,8 @@ from src.display.formatting import has_no_nan_values, make_clickable_model
 from src.display.utils import AutoEvalColumn, EvalQueueColumn
 from src.leaderboard.read_evals import get_raw_eval_results
 TASK_NAME_INVERSE_MAP = dict()
 for task in Tasks:
@@ -51,9 +53,11 @@ def get_leaderboard_df(results_path: str, requests_path: str, cols: list, benchm
     df = df.fillna(EMPTY_SYMBOL)
     # make values clickable and link to log files
     for col in benchmark_cols:
-        df[col] = df[[AutoEvalColumn.model.name, col]].apply(lambda x: f"[{x[col]}]({get_inspect_log_url(model_name=x[AutoEvalColumn.model.name].split('>')[1].split('<')[0], benchmark_name=TASK_NAME_INVERSE_MAP[col]['name'])})" if x[col] != EMPTY_SYMBOL else x[col], axis=1)
     return df

 from src.display.utils import AutoEvalColumn, EvalQueueColumn
 from src.leaderboard.read_evals import get_raw_eval_results
+from refactor_eval_results import MODEL_VERSION_MAP
 TASK_NAME_INVERSE_MAP = dict()
 for task in Tasks:
     df = df.fillna(EMPTY_SYMBOL)
+    inverse_model_version_map = {v: k for k, v in MODEL_VERSION_MAP.items()}
     # make values clickable and link to log files
     for col in benchmark_cols:
+        df[col] = df[[AutoEvalColumn.model.name, col]].apply(lambda x: f"[{x[col]}]({get_inspect_log_url(model_name=inverse_model_version_map[x[AutoEvalColumn.model.name].split('>')[1].split('<')[0]], benchmark_name=TASK_NAME_INVERSE_MAP[col]['name'])})" if x[col] != EMPTY_SYMBOL else x[col], axis=1)
     return df