H2H-eval-comparator

Sleeping

rohansampath commited on Feb 26

Commit

b03c5d3

verified ·

1 Parent(s): 7798c9f

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -160,23 +160,30 @@ with gr.Blocks(css="""
         border-radius: 8px;
         padding: 10px;
     }
 """) as demo:
     gr.Markdown("# Head-to-Head Model Evaluation Comparator")
     gr.Markdown("""
-    This demo evaluates two models (or one model with two different configs) on a benchmark dataset.
-    Available Datasets:[MMLU-Pro](https://huggingface.co/datasets/TIGER-Lab/MMLU-Pro)
-    Available Models: [Mistral-7B-v0.1](https://huggingface.co/mistralai/Mistral-7B-v0.1)
     """)
     # Dataset Selection Section
-    gr.Markdown("## (A) Select Dataset for evaluation")
     with gr.Row():
         dataset_dropdown = gr.Dropdown(
             choices=["(Select Dataset)", "MMLU-Pro"],
             value="(Select Dataset)",
             label="Dataset",
-            info="Select a dataset to perform the Head to Head Evaluation on. Available Datasets: [MMLU-Pro](https://huggingface.co/datasets/TIGER-Lab/MMLU-Pro)"
         )
         preview_toggle = gr.Button("Show Preview", interactive=False, variant="secondary")

         border-radius: 8px;
         padding: 10px;
     }
+    h1 {
+        text-align: center;
+    }
 """) as demo:
     gr.Markdown("# Head-to-Head Model Evaluation Comparator")
     gr.Markdown("""
+    This demo evaluates two models (or one model with two different configs), head-to-head, on a benchmark dataset.
+    Available Datasets:
+    - [MMLU-Pro](https://huggingface.co/datasets/TIGER-Lab/MMLU-Pro)
+    Available Models:
+    - [Mistral-7B-v0.1](https://huggingface.co/mistralai/Mistral-7B-v0.1)
     """)
     # Dataset Selection Section
+    gr.Markdown("## (A) Select Dataset for Evaluation")
     with gr.Row():
         dataset_dropdown = gr.Dropdown(
             choices=["(Select Dataset)", "MMLU-Pro"],
             value="(Select Dataset)",
             label="Dataset",
+            info="Select a dataset to perform the Head-to-Head Evaluation on. Available Datasets: [MMLU-Pro](https://huggingface.co/datasets/TIGER-Lab/MMLU-Pro)"
         )
         preview_toggle = gr.Button("Show Preview", interactive=False, variant="secondary")