Spaces:

InfiniAILab
/

GSM-Infinite-Leaderboard

Running

atlas5301 commited on Feb 6

Commit

7243e58

1 Parent(s): 22df38a

make it look better

Files changed (3) hide show

pages/benchmark_viewer.py CHANGED Viewed

@@ -33,20 +33,20 @@ def show():
     with col1:
         datasets = df['dataset'].unique()
-        selected_datasets = st.multiselect("Dataset(s)", datasets, default=datasets)
-        # Filter data based on selected datasets first
         filtered_df = df[df['dataset'].isin(selected_datasets)]
         lengths = sorted(filtered_df['length'].unique())
         # Disable length filter if no datasets are selected
         disabled = not selected_datasets
-        selected_lengths = st.multiselect("Length(s)", lengths, default=lengths if not disabled and lengths else [], disabled=disabled)
     with col2:
         # Single Model Multiselect (filtered by selected datasets)
         available_models = filtered_df['model'].unique()
-        selected_models = st.multiselect("Model(s)", available_models, default=available_models) # Handle empty defaults
     with col3:
         min_op, max_op = st.slider("Op Range", int(filtered_df['op'].min()), int(filtered_df['op'].max()), (int(filtered_df['op'].min()), int(filtered_df['op'].max())))
@@ -82,7 +82,7 @@ def show():
                         ))
         y_title = "Log(Accuracy)" if log_scale else "Accuracy"
-        fig.update_layout(title=f"{y_title} vs Op", xaxis_title="Op", yaxis_title=y_title)
         return fig
     view_option = st.radio("View", ["Accuracy", "Log(Accuracy)"])

     with col1:
         datasets = df['dataset'].unique()
+        selected_datasets = st.multiselect("Dataset(s)", datasets, default=['symbolic']) # Default to 'symbolic'
         filtered_df = df[df['dataset'].isin(selected_datasets)]
         lengths = sorted(filtered_df['length'].unique())
         # Disable length filter if no datasets are selected
         disabled = not selected_datasets
+        selected_lengths = st.multiselect("Length(s)", lengths, default=[0] if not disabled and 0 in lengths else [], disabled=disabled) # Default to 0 if available
     with col2:
         # Single Model Multiselect (filtered by selected datasets)
         available_models = filtered_df['model'].unique()
+        selected_models = st.multiselect("Model(s)", available_models, default=['qwen-2.5-7b-instruct'] if 'qwen-2.5-7b-instruct' in available_models else available_models) # Default to qwen-2.5-7b-instruct if available, otherwise select all
     with col3:
         min_op, max_op = st.slider("Op Range", int(filtered_df['op'].min()), int(filtered_df['op'].max()), (int(filtered_df['op'].min()), int(filtered_df['op'].max())))
                         ))
         y_title = "Log(Accuracy)" if log_scale else "Accuracy"
+        fig.update_layout(title=f"{y_title} vs Op", xaxis_title="Op", yaxis_title=y_title, width=800, height=600)
         return fig
     view_option = st.radio("View", ["Accuracy", "Log(Accuracy)"])

pages/long_context.py CHANGED Viewed

@@ -4,7 +4,9 @@ from utils.style import style_long_context
 @st.cache_data
 def load_data():
-    return pd.read_csv("data/long_context.csv")
 def show():
     st.title("Long Context Leaderboard")
@@ -17,7 +19,7 @@ def show():
     st.dataframe(
         styled_df,
         use_container_width=True,
-        height=600,
         hide_index=True,
         column_config={
             "Model": st.column_config.TextColumn(width="large"),

 @st.cache_data
 def load_data():
+    df = pd.read_csv("data/long_context.csv")
+    df.dropna(inplace=True) # Drop rows with any missing values
+    return df
 def show():
     st.title("Long Context Leaderboard")
     st.dataframe(
         styled_df,
         use_container_width=True,
+        height=35*(len(df)+1),
         hide_index=True,
         column_config={
             "Model": st.column_config.TextColumn(width="large"),

pages/zero_context.py CHANGED Viewed

@@ -22,7 +22,7 @@ def show():
         styled_df,
         use_container_width=True,
         hide_index=True,
-        height=800,
         column_config={
             "Model": st.column_config.TextColumn(width="large"),
             "Symbolic": st.column_config.NumberColumn(format="%.2f"),

         styled_df,
         use_container_width=True,
         hide_index=True,
+        height=35*(1+len(raw_df)),
         column_config={
             "Model": st.column_config.TextColumn(width="large"),
             "Symbolic": st.column_config.NumberColumn(format="%.2f"),