open-r1-eval-leaderboard

Running

lewtun HF Staff commited on Mar 28, 2024

Commit

88fd41c

1 Parent(s): 486aa44

Update evals

Files changed (1) hide show

app.py CHANGED Viewed

@@ -49,7 +49,10 @@ def get_leaderboard_df(merge_values: bool = True):
                 value = data["results"][first_result_key]["acc_norm"]
             # BBH has several metrics but we report just the average one
             elif task.lower() == "bbh":
-                value = [v["qem"] for k, v in data["results"].items() if "_average" in k.lower()][0]
             else:
                 first_metric_key = next(
                     iter(data["results"][first_result_key])

                 value = data["results"][first_result_key]["acc_norm"]
             # BBH has several metrics but we report just the average one
             elif task.lower() == "bbh":
+                value = data["results"]["all"]["acc"] if "all" in data["results"] else None
+            # AGIEval reports acc_norm
+            elif task.lower() == "agieval":
+                value = data["results"]["all"]["acc_norm"]
             else:
                 first_metric_key = next(
                     iter(data["results"][first_result_key])