open_pl_llm_leaderboard

Running on CPU Upgrade

djstrong commited on Feb 24, 2024

Commit

0d4d8e0

1 Parent(s): 738a279

s

Files changed (1) hide show

src/leaderboard/read_evals.py CHANGED Viewed

@@ -108,6 +108,7 @@ class EvalResult:
     def to_dict(self):
         """Converts the Eval Result to a dict compatible with our dataframe display"""
         average = sum([v for v in self.results.values() if v is not None]) / len(Tasks)
         data_dict={}
         # data_dict = {
         #     "eval_name": self.eval_name,  # not a column, just a save name,
@@ -198,7 +199,10 @@ class EvalResult:
         for task in Tasks:
-            data_dict[task.value.col_name] = self.results[task.value.benchmark]
         return data_dict

     def to_dict(self):
         """Converts the Eval Result to a dict compatible with our dataframe display"""
         average = sum([v for v in self.results.values() if v is not None]) / len(Tasks)
+        print('average', average)
         data_dict={}
         # data_dict = {
         #     "eval_name": self.eval_name,  # not a column, just a save name,
         for task in Tasks:
+            try:
+                data_dict[task.value.col_name] = self.results[task.value.benchmark]
+            except KeyError:
+                print(f"Could not find {task.value.col_name}")
         return data_dict