Spaces:

CIIRC-NLP
/

czechbench_leaderboard

Running

App Files Files Community

Adam Jirkovsky commited on Sep 10, 2024

Commit

54b05ee

1 Parent(s): 6bebd55

Revert header changes

Browse files

Files changed (2) hide show

app.py +1 -1
src/display/utils.py +24 -25

app.py CHANGED Viewed

@@ -215,7 +215,7 @@ with demo:
                     + shown_columns.value
                 ],
-                headers=[c.display_name for c in fields(AutoEvalColumn) if c.never_hidden] + shown_columns.value,
                 datatype=TYPES,
                 elem_id="leaderboard-table",
                 interactive=False,

                     + shown_columns.value
                 ],
+                headers=[c.name for c in fields(AutoEvalColumn) if c.never_hidden] + shown_columns.value,
                 datatype=TYPES,
                 elem_id="leaderboard-table",
                 interactive=False,

src/display/utils.py CHANGED Viewed

@@ -16,7 +16,6 @@ def fields(raw_class):
 @dataclass
 class ColumnContent:
     name: str
-    display_name: str
     type: str
     displayed_by_default: bool
     hidden: bool = False
@@ -48,24 +47,24 @@ auto_eval_column_dict.append(["revision", ColumnContent, ColumnContent("Model sh
 auto_eval_column_dict.append(["dummy", ColumnContent, ColumnContent("model_name_for_query", "str", False, dummy=True)])
 """
-auto_eval_column_dict.append(["eval_name", ColumnContent, ColumnContent("eval_name", "Model", "str", True, never_hidden=True)])
-auto_eval_column_dict.append(["precision", ColumnContent, ColumnContent("precision", "Precision", "str", True)])
-auto_eval_column_dict.append(["hf_model_id", ColumnContent, ColumnContent("hf_model_id", "Model link (temporary)", "str", True)])
-auto_eval_column_dict.append(["agree_cs", ColumnContent, ColumnContent("agree_cs", "AGREE", "number", True)])
-auto_eval_column_dict.append(["anli_cs", ColumnContent, ColumnContent("anli_cs", "ANLI", "number", True)])
-auto_eval_column_dict.append(["arc_challenge_cs", ColumnContent, ColumnContent("arc_challenge_cs", "ARC-Challenge", "number", True)])
-auto_eval_column_dict.append(["arc_easy_cs", ColumnContent, ColumnContent("arc_easy_cs", "ARC-Easy", "number", True)])
-auto_eval_column_dict.append(["belebele_cs", ColumnContent, ColumnContent("belebele_cs", "Belebele", "number", True)])
-auto_eval_column_dict.append(["ctkfacts_cs", ColumnContent, ColumnContent("ctkfacts_cs", "CTKFacts", "number", True)])
-auto_eval_column_dict.append(["czechnews_cs", ColumnContent, ColumnContent("czechnews_cs", "Czech News", "number", True)])
-auto_eval_column_dict.append(["fb_comments_cs", ColumnContent, ColumnContent("fb_comments_cs", "Facebook Comments", "number", True)])
-auto_eval_column_dict.append(["gsm8k_cs", ColumnContent, ColumnContent("gsm8k_cs", "GSM8K", "number", True)])
-auto_eval_column_dict.append(["klokanek_cs", ColumnContent, ColumnContent("klokanek_cs", "Klokanek", "number", True)])
-auto_eval_column_dict.append(["mall_reviews_cs", ColumnContent, ColumnContent("mall_reviews_cs", "Mall Reviews", "number", True)])
-auto_eval_column_dict.append(["mmlu_cs", ColumnContent, ColumnContent("mmlu_cs", "MMLU", "number", True)])
-auto_eval_column_dict.append(["sqad_cs", ColumnContent, ColumnContent("sqad_cs", "SQAD", "number", True)])
-auto_eval_column_dict.append(["subjectivity_cs", ColumnContent, ColumnContent("subjectivity_cs", "Subjectivity", "number", True)])
-auto_eval_column_dict.append(["truthfulqa_cs", ColumnContent, ColumnContent("truthfulqa_cs", "TruthfulQA", "number", True)])
 # We use make dataclass to dynamically fill the scores from Tasks
@@ -75,12 +74,12 @@ AutoEvalColumn = make_dataclass("AutoEvalColumn", auto_eval_column_dict, frozen=
 ## For the queue columns in the submission tab
 @dataclass(frozen=True)
 class EvalQueueColumn:  # Queue column
-    model = ColumnContent("model", "Model", "markdown", True)
-    revision = ColumnContent("revision", "Revision", "str", True)
-    private = ColumnContent("private", "Private", "bool", True)
-    precision = ColumnContent("precision", "Precision", "str", True)
-    weight_type = ColumnContent("weight_type", "Weight Type", "str", "Original")
-    status = ColumnContent("status", "Status", "str", True)
 ## All the model information that we might need

 @dataclass
 class ColumnContent:
     name: str
     type: str
     displayed_by_default: bool
     hidden: bool = False
 auto_eval_column_dict.append(["dummy", ColumnContent, ColumnContent("model_name_for_query", "str", False, dummy=True)])
 """
+auto_eval_column_dict.append(["eval_name", ColumnContent, ColumnContent("eval_name", "str", True, never_hidden=True)])
+auto_eval_column_dict.append(["precision", ColumnContent, ColumnContent("precision", "str", True)])
+auto_eval_column_dict.append(["hf_model_id", ColumnContent, ColumnContent("hf_model_id", "str", True)])
+auto_eval_column_dict.append(["agree_cs", ColumnContent, ColumnContent("agree_cs", "number", True)])
+auto_eval_column_dict.append(["anli_cs", ColumnContent, ColumnContent("anli_cs", "number", True)])
+auto_eval_column_dict.append(["arc_challenge_cs", ColumnContent, ColumnContent("arc_challenge_cs", "number", True)])
+auto_eval_column_dict.append(["arc_easy_cs", ColumnContent, ColumnContent("arc_easy_cs", "number", True)])
+auto_eval_column_dict.append(["belebele_cs", ColumnContent, ColumnContent("belebele_cs", "number", True)])
+auto_eval_column_dict.append(["ctkfacts_cs", ColumnContent, ColumnContent("ctkfacts_cs", "number", True)])
+auto_eval_column_dict.append(["czechnews_cs", ColumnContent, ColumnContent("czechnews_cs", "number", True)])
+auto_eval_column_dict.append(["fb_comments_cs", ColumnContent, ColumnContent("fb_comments_cs", "number", True)])
+auto_eval_column_dict.append(["gsm8k_cs", ColumnContent, ColumnContent("gsm8k_cs", "number", True)])
+auto_eval_column_dict.append(["klokanek_cs", ColumnContent, ColumnContent("klokanek_cs", "number", True)])
+auto_eval_column_dict.append(["mall_reviews_cs", ColumnContent, ColumnContent("mall_reviews_cs", "number", True)])
+auto_eval_column_dict.append(["mmlu_cs", ColumnContent, ColumnContent("mmlu_cs", "number", True)])
+auto_eval_column_dict.append(["sqad_cs", ColumnContent, ColumnContent("sqad_cs", "number", True)])
+auto_eval_column_dict.append(["subjectivity_cs", ColumnContent, ColumnContent("subjectivity_cs", "number", True)])
+auto_eval_column_dict.append(["truthfulqa_cs", ColumnContent, ColumnContent("truthfulqa_cs", "number", True)])
 # We use make dataclass to dynamically fill the scores from Tasks
 ## For the queue columns in the submission tab
 @dataclass(frozen=True)
 class EvalQueueColumn:  # Queue column
+    model = ColumnContent("model", "markdown", True)
+    revision = ColumnContent("revision", "str", True)
+    private = ColumnContent("private", "bool", True)
+    precision = ColumnContent("precision", "str", True)
+    weight_type = ColumnContent("weight_type", "str", "Original")
+    status = ColumnContent("status", "str", True)
 ## All the model information that we might need