Spaces:

CultriX
/

Tiny-LeaderBoard

Running

App Files Files Community

CultriX commited on Mar 1

Commit

6acb805

verified ·

1 Parent(s): 06fd517

Update app.py

Browse files

Files changed (1) hide show

app.py +512 -0

app.py CHANGED Viewed

@@ -319,6 +319,518 @@ def download_all_data():
 # --------------------------------------------------------------------
 # This is your larger dataset, rank = 44..105
 benchmark_data = [
     {
         "rank": 1,
         "name": "suayptalha/Lamarckvergence-14B",

 # --------------------------------------------------------------------
 # This is your larger dataset, rank = 44..105
 benchmark_data = [
+    {
+        "Model Rank": "1",
+        "Icon": "├░┬ñ",
+        "Model Name": "wanlige/li-14b-v0.4",
+        "Average Score": "43.66 %",
+        "IFEval Score": "81.33 %",
+        "BBH Score": "50.38 %",
+        "MATH Score": "55.74 %",
+        "GPQA Score": "11.86 %",
+        "MUSR Score": "16.35 %",
+        "MMLU-PRO Score": "46.30 %",
+        "Model Architecture": "Qwen2ForCausalLM",
+        "Model Precision": "bfloat16",
+        "Model Parameters": "14.77B",
+        "Chat Template Use": "Yes"
+    },
+    {
+        "Model Rank": "2",
+        "Icon": "├░┬ñ",
+        "Model Name": "suayptalha/Lamarckvergence-14B",
+        "Average Score": "43.32 %",
+        "IFEval Score": "76.56 %",
+        "BBH Score": "50.33 %",
+        "MATH Score": "54.00 %",
+        "GPQA Score": "15.10 %",
+        "MUSR Score": "16.34 %",
+        "MMLU-PRO Score": "47.59 %",
+        "Model Architecture": "Qwen2ForCausalLM",
+        "Model Precision": "bfloat16",
+        "Model Parameters": "14.766B",
+        "Chat Template Use": "Yes"
+    },
+    {
+        "Model Rank": "3",
+        "Icon": "├░┬ñ",
+        "Model Name": "wanlige/li-14b-v0.4-slerp0.1",
+        "Average Score": "42.91 %",
+        "IFEval Score": "79.23 %",
+        "BBH Score": "50.88 %",
+        "MATH Score": "53.32 %",
+        "GPQA Score": "14.54 %",
+        "MUSR Score": "11.75 %",
+        "MMLU-PRO Score": "47.71 %",
+        "Model Architecture": "Qwen2ForCausalLM",
+        "Model Precision": "bfloat16",
+        "Model Parameters": "14.766B",
+        "Chat Template Use": "Yes"
+    },
+    {
+        "Model Rank": "4",
+        "Icon": "├░┬¼",
+        "Model Name": "sthenno-com/miscii-14b-0218",
+        "Average Score": "42.90 %",
+        "IFEval Score": "76.56 %",
+        "BBH Score": "50.64 %",
+        "MATH Score": "51.44 %",
+        "GPQA Score": "17.79 %",
+        "MUSR Score": "13.21 %",
+        "MMLU-PRO Score": "47.75 %",
+        "Model Architecture": "Qwen2ForCausalLM",
+        "Model Precision": "bfloat16",
+        "Model Parameters": "14.766B",
+        "Chat Template Use": "Yes"
+    },
+    {
+        "Model Rank": "5",
+        "Icon": "├░┬╢",
+        "Model Name": "sthenno/tempesthenno-ppo-ckpt40",
+        "Average Score": "42.74 %",
+        "IFEval Score": "79.23 %",
+        "BBH Score": "50.57 %",
+        "MATH Score": "47.36 %",
+        "GPQA Score": "17.00 %",
+        "MUSR Score": "14.56 %",
+        "MMLU-PRO Score": "47.69 %",
+        "Model Architecture": "Qwen2ForCausalLM",
+        "Model Precision": "bfloat16",
+        "Model Parameters": "14.766B",
+        "Chat Template Use": "Yes"
+    },
+    {
+        "Model Rank": "6",
+        "Icon": "├░┬¼",
+        "Model Name": "tanliboy/lambda-qwen2.5-14b-dpo-test",
+        "Average Score": "42.62 %",
+        "IFEval Score": "82.31 %",
+        "BBH Score": "48.45 %",
+        "MATH Score": "54.61 %",
+        "GPQA Score": "14.99 %",
+        "MUSR Score": "12.59 %",
+        "MMLU-PRO Score": "42.75 %",
+        "Model Architecture": "Qwen2ForCausalLM",
+        "Model Precision": "bfloat16",
+        "Model Parameters": "14.77B",
+        "Chat Template Use": "Yes"
+    },
+    {
+        "Model Rank": "7",
+        "Icon": "├░┬╢",
+        "Model Name": "sthenno/tempesthenno-nuslerp-001",
+        "Average Score": "42.59 %",
+        "IFEval Score": "79.26 %",
+        "BBH Score": "51.04 %",
+        "MATH Score": "47.58 %",
+        "GPQA Score": "16.44 %",
+        "MUSR Score": "13.88 %",
+        "MMLU-PRO Score": "47.30 %",
+        "Model Architecture": "Qwen2ForCausalLM",
+        "Model Precision": "bfloat16",
+        "Model Parameters": "14.766B",
+        "Chat Template Use": "Yes"
+    },
+    {
+        "Model Rank": "8",
+        "Icon": "├░┬ñ",
+        "Model Name": "YOYO-AI/Qwen2.5-14B-1M-YOYO-V3",
+        "Average Score": "42.56 %",
+        "IFEval Score": "83.98 %",
+        "BBH Score": "49.47 %",
+        "MATH Score": "53.55 %",
+        "GPQA Score": "10.51 %",
+        "MUSR Score": "11.10 %",
+        "MMLU-PRO Score": "46.74 %",
+        "Model Architecture": "Qwen2ForCausalLM",
+        "Model Precision": "float16",
+        "Model Parameters": "14.766B",
+        "Chat Template Use": "Yes"
+    },
+    {
+        "Model Rank": "9",
+        "Icon": "├░┬╢",
+        "Model Name": "Goekdeniz-Guelmez/Josiefied-Qwen2.5-14B-Instruct-abliterated-v4",
+        "Average Score": "42.55 %",
+        "IFEval Score": "82.92 %",
+        "BBH Score": "48.05 %",
+        "MATH Score": "54.23 %",
+        "GPQA Score": "12.30 %",
+        "MUSR Score": "13.15 %",
+        "MMLU-PRO Score": "44.65 %",
+        "Model Architecture": "Qwen2ForCausalLM",
+        "Model Precision": "bfloat16",
+        "Model Parameters": "14.77B",
+        "Chat Template Use": "Yes"
+    },
+    {
+        "Model Rank": "10",
+        "Icon": "├░┬ñ",
+        "Model Name": "djuna/Q2.5-Veltha-14B",
+        "Average Score": "42.52 %",
+        "IFEval Score": "82.92 %",
+        "BBH Score": "49.75 %",
+        "MATH Score": "47.89 %",
+        "GPQA Score": "14.54 %",
+        "MUSR Score": "12.26 %",
+        "MMLU-PRO Score": "47.76 %",
+        "Model Architecture": "Qwen2ForCausalLM",
+        "Model Precision": "bfloat16",
+        "Model Parameters": "14.766B",
+        "Chat Template Use": "Yes"
+    },
+    {
+        "Model Rank": "11",
+        "Icon": "├░┬╢",
+        "Model Name": "arcee-ai/Virtuoso-Small-v2",
+        "Average Score": "42.48 %",
+        "IFEval Score": "82.73 %",
+        "BBH Score": "50.95 %",
+        "MATH Score": "46.60 %",
+        "GPQA Score": "13.76 %",
+        "MUSR Score": "14.28 %",
+        "MMLU-PRO Score": "46.53 %",
+        "Model Architecture": "Qwen2ForCausalLM",
+        "Model Precision": "bfloat16",
+        "Model Parameters": "14.766B",
+        "Chat Template Use": "Yes"
+    },
+    {
+        "Model Rank": "12",
+        "Icon": "├░┬ñ",
+        "Model Name": "YOYO-AI/Qwen2.5-14B-YOYO-V4-p1",
+        "Average Score": "42.46 %",
+        "IFEval Score": "82.03 %",
+        "BBH Score": "50.25 %",
+        "MATH Score": "53.32 %",
+        "GPQA Score": "12.75 %",
+        "MUSR Score": "11.73 %",
+        "MMLU-PRO Score": "44.67 %",
+        "Model Architecture": "Qwen2ForCausalLM",
+        "Model Precision": "float16",
+        "Model Parameters": "14.766B",
+        "Chat Template Use": "Yes"
+    },
+    {
+        "Model Rank": "13",
+        "Icon": "├░┬¼",
+        "Model Name": "jpacifico/Chocolatine-14B-Instruct-DPO-v1.3",
+        "Average Score": "42.42 %",
+        "IFEval Score": "70.40 %",
+        "BBH Score": "54.85 %",
+        "MATH Score": "56.19 %",
+        "GPQA Score": "12.19 %",
+        "MUSR Score": "12.29 %",
+        "MMLU-PRO Score": "48.60 %",
+        "Model Architecture": "Phi3ForCausalLM",
+        "Model Precision": "float16",
+        "Model Parameters": "14.66B",
+        "Chat Template Use": "Yes"
+    },
+    {
+        "Model Rank": "14",
+        "Icon": "├░┬¼",
+        "Model Name": "sthenno-com/miscii-14b-1028",
+        "Average Score": "42.38 %",
+        "IFEval Score": "82.37 %",
+        "BBH Score": "49.26 %",
+        "MATH Score": "50.30 %",
+        "GPQA Score": "14.21 %",
+        "MUSR Score": "12.00 %",
+        "MMLU-PRO Score": "46.14 %",
+        "Model Architecture": "Qwen2ForCausalLM",
+        "Model Precision": "bfloat16",
+        "Model Parameters": "14.77B",
+        "Chat Template Use": "Yes"
+    },
+    {
+        "Model Rank": "15",
+        "Icon": "├░┬¼",
+        "Model Name": "sthenno-com/miscii-14b-1225",
+        "Average Score": "42.35 %",
+        "IFEval Score": "78.78 %",
+        "BBH Score": "50.91 %",
+        "MATH Score": "45.17 %",
+        "GPQA Score": "17.00 %",
+        "MUSR Score": "14.77 %",
+        "MMLU-PRO Score": "47.46 %",
+        "Model Architecture": "Qwen2ForCausalLM",
+        "Model Precision": "bfloat16",
+        "Model Parameters": "14.766B",
+        "Chat Template Use": "Yes"
+    },
+    {
+        "Model Rank": "16",
+        "Icon": "├░┬╢",
+        "Model Name": "prithivMLmods/Sombrero-Opus-14B-Elite5",
+        "Average Score": "42.32 %",
+        "IFEval Score": "78.81 %",
+        "BBH Score": "50.17 %",
+        "MATH Score": "53.55 %",
+        "GPQA Score": "11.52 %",
+        "MUSR Score": "13.22 %",
+        "MMLU-PRO Score": "46.67 %",
+        "Model Architecture": "Qwen2ForCausalLM",
+        "Model Precision": "float16",
+        "Model Parameters": "14.766B",
+        "Chat Template Use": "Yes"
+    },
+    {
+        "Model Rank": "17",
+        "Icon": "├░┬ñ",
+        "Model Name": "Lunzima/NQLSG-Qwen2.5-14B-MegaFusion-v8",
+        "Average Score": "42.26 %",
+        "IFEval Score": "73.84 %",
+        "BBH Score": "49.31 %",
+        "MATH Score": "41.69 %",
+        "GPQA Score": "18.23 %",
+        "MUSR Score": "21.96 %",
+        "MMLU-PRO Score": "48.50 %",
+        "Model Architecture": "Qwen2ForCausalLM",
+        "Model Precision": "bfloat16",
+        "Model Parameters": "14.766B",
+        "Chat Template Use": "No"
+    },
+    {
+        "Model Rank": "18",
+        "Icon": "├░┬╢",
+        "Model Name": "prithivMLmods/Equuleus-Opus-14B-Exp",
+        "Average Score": "42.20 %",
+        "IFEval Score": "70.01 %",
+        "BBH Score": "48.62 %",
+        "MATH Score": "45.85 %",
+        "GPQA Score": "18.23 %",
+        "MUSR Score": "21.90 %",
+        "MMLU-PRO Score": "48.60 %",
+        "Model Architecture": "Qwen2ForCausalLM",
+        "Model Precision": "bfloat16",
+        "Model Parameters": "14.766B",
+        "Chat Template Use": "No"
+    },
+    {
+        "Model Rank": "19",
+        "Icon": "├░┬╢",
+        "Model Name": "rombodawg/Rombos-LLM-V2.6-Qwen-14b",
+        "Average Score": "42.20 %",
+        "IFEval Score": "84.32 %",
+        "BBH Score": "49.28 %",
+        "MATH Score": "52.11 %",
+        "GPQA Score": "11.19 %",
+        "MUSR Score": "12.29 %",
+        "MMLU-PRO Score": "44.01 %",
+        "Model Architecture": "Qwen2ForCausalLM",
+        "Model Precision": "bfloat16",
+        "Model Parameters": "14.77B",
+        "Chat Template Use": "Yes"
+    },
+    {
+        "Model Rank": "20",
+        "Icon": "├░┬ñ",
+        "Model Name": "nbeerbower/EVA-abliterated-TIES-Qwen2.5-14B",
+        "Average Score": "42.16 %",
+        "IFEval Score": "78.36 %",
+        "BBH Score": "48.52 %",
+        "MATH Score": "50.45 %",
+        "GPQA Score": "13.98 %",
+        "MUSR Score": "14.88 %",
+        "MMLU-PRO Score": "46.79 %",
+        "Model Architecture": "Qwen2ForCausalLM",
+        "Model Precision": "bfloat16",
+        "Model Parameters": "14.77B",
+        "Chat Template Use": "Yes"
+    },
+    {
+        "Model Rank": "21",
+        "Icon": "├░┬ñ",
+        "Model Name": "sometimesanotion/LamarckInfusion-14B-v1",
+        "Average Score": "42.06 %",
+        "IFEval Score": "71.98 %",
+        "BBH Score": "50.35 %",
+        "MATH Score": "41.69 %",
+        "GPQA Score": "18.79 %",
+        "MUSR Score": "20.90 %",
+        "MMLU-PRO Score": "48.63 %",
+        "Model Architecture": "Qwen2ForCausalLM",
+        "Model Precision": "bfloat16",
+        "Model Parameters": "14.766B",
+        "Chat Template Use": "No"
+    },
+    {
+        "Model Rank": "22",
+        "Icon": "├░┬ñ",
+        "Model Name": "tensopolis/virtuoso-small-v2-tensopolis-v1",
+        "Average Score": "41.99 %",
+        "IFEval Score": "82.40 %",
+        "BBH Score": "50.53 %",
+        "MATH Score": "46.53 %",
+        "GPQA Score": "12.53 %",
+        "MUSR Score": "13.88 %",
+        "MMLU-PRO Score": "46.07 %",
+        "Model Architecture": "Qwen2ForCausalLM",
+        "Model Precision": "bfloat16",
+        "Model Parameters": "14.766B",
+        "Chat Template Use": "Yes"
+    },
+    {
+        "Model Rank": "23",
+        "Icon": "├░┬ñ",
+        "Model Name": "Quazim0t0/Fugazi14b",
+        "Average Score": "41.94 %",
+        "IFEval Score": "69.98 %",
+        "BBH Score": "56.09 %",
+        "MATH Score": "46.53 %",
+        "GPQA Score": "13.53 %",
+        "MUSR Score": "16.42 %",
+        "MMLU-PRO Score": "49.08 %",
+        "Model Architecture": "LlamaForCausalLM",
+        "Model Precision": "bfloat16",
+        "Model Parameters": "14.66B",
+        "Chat Template Use": "Yes"
+    },
+    {
+        "Model Rank": "24",
+        "Icon": "├░┬╢",
+        "Model Name": "1024m/QWEN-14B-B100",
+        "Average Score": "41.92 %",
+        "IFEval Score": "77.62 %",
+        "BBH Score": "49.78 %",
+        "MATH Score": "54.38 %",
+        "GPQA Score": "13.42 %",
+        "MUSR Score": "9.88 %",
+        "MMLU-PRO Score": "46.43 %",
+        "Model Architecture": "Qwen2ForCausalLM",
+        "Model Precision": "bfloat16",
+        "Model Parameters": "14.77B",
+        "Chat Template Use": "Yes"
+    },
+    {
+        "Model Rank": "25",
+        "Icon": "├░┬╢",
+        "Model Name": "Sakalti/Saka-14B",
+        "Average Score": "41.91 %",
+        "IFEval Score": "71.74 %",
+        "BBH Score": "49.72 %",
+        "MATH Score": "40.94 %",
+        "GPQA Score": "19.46 %",
+        "MUSR Score": "20.74 %",
+        "MMLU-PRO Score": "48.84 %",
+        "Model Architecture": "Qwen2ForCausalLM",
+        "Model Precision": "float16",
+        "Model Parameters": "14.766B",
+        "Chat Template Use": "No"
+    },
+    {
+        "Model Rank": "26",
+        "Icon": "├░┬╢",
+        "Model Name": "prithivMLmods/Sombrero-Opus-14B-Elite6",
+        "Average Score": "41.88 %",
+        "IFEval Score": "72.26 %",
+        "BBH Score": "49.60 %",
+        "MATH Score": "40.79 %",
+        "GPQA Score": "19.13 %",
+        "MUSR Score": "20.74 %",
+        "MMLU-PRO Score": "48.78 %",
+        "Model Architecture": "Qwen2ForCausalLM",
+        "Model Precision": "bfloat16",
+        "Model Parameters": "14.766B",
+        "Chat Template Use": "No"
+    },
+    {
+        "Model Rank": "27",
+        "Icon": "├░┬ñ",
+        "Model Name": "YOYO-AI/Qwen2.5-14B-YOYO-latest-V2",
+        "Average Score": "41.85 %",
+        "IFEval Score": "77.71 %",
+        "BBH Score": "47.30 %",
+        "MATH Score": "51.59 %",
+        "GPQA Score": "13.87 %",
+        "MUSR Score": "13.68 %",
+        "MMLU-PRO Score": "46.93 %",
+        "Model Architecture": "Qwen2ForCausalLM",
+        "Model Precision": "float16",
+        "Model Parameters": "14.766B",
+        "Chat Template Use": "Yes"
+    },
+    {
+        "Model Rank": "28",
+        "Icon": "├░┬¼",
+        "Model Name": "Tsunami-th/Tsunami-1.0-14B-Instruct",
+        "Average Score": "41.84 %",
+        "IFEval Score": "78.29 %",
+        "BBH Score": "49.15 %",
+        "MATH Score": "45.85 %",
+        "GPQA Score": "14.21 %",
+        "MUSR Score": "16.34 %",
+        "MMLU-PRO Score": "47.21 %",
+        "Model Architecture": "Qwen2ForCausalLM",
+        "Model Precision": "bfloat16",
+        "Model Parameters": "14.77B",
+        "Chat Template Use": "Yes"
+    },
+    {
+        "Model Rank": "29",
+        "Icon": "├░┬╢",
+        "Model Name": "sthenno/tempesthenno-kto-0205-ckpt80",
+        "Average Score": "41.79 %",
+        "IFEval Score": "80.54 %",
+        "BBH Score": "50.64 %",
+        "MATH Score": "45.92 %",
+        "GPQA Score": "13.09 %",
+        "MUSR Score": "12.93 %",
+        "MMLU-PRO Score": "47.62 %",
+        "Model Architecture": "Qwen2ForCausalLM",
+        "Model Precision": "bfloat16",
+        "Model Parameters": "14.766B",
+        "Chat Template Use": "No"
+    },
+    {
+        "Model Rank": "30",
+        "Icon": "├░┬ñ",
+        "Model Name": "sometimesanotion/Lamarck-14B-v0.7-rc4",
+        "Average Score": "41.79 %",
+        "IFEval Score": "72.11 %",
+        "BBH Score": "49.85 %",
+        "MATH Score": "40.26 %",
+        "GPQA Score": "18.57 %",
+        "MUSR Score": "21.07 %",
+        "MMLU-PRO Score": "48.89 %",
+        "Model Architecture": "Qwen2ForCausalLM",
+        "Model Precision": "bfloat16",
+        "Model Parameters": "14.766B",
+        "Chat Template Use": "No"
+    },
+    {
+        "Model Rank": "31",
+        "Icon": "├░┬╢",
+        "Model Name": "prithivMLmods/Porpoise-Opus-14B-Exp",
+        "Average Score": "41.77 %",
+        "IFEval Score": "70.98 %",
+        "BBH Score": "49.95 %",
+        "MATH Score": "40.41 %",
+        "GPQA Score": "19.13 %",
+        "MUSR Score": "21.30 %",
+        "MMLU-PRO Score": "48.85 %",
+        "Model Architecture": "Qwen2ForCausalLM",
+        "Model Precision": "bfloat16",
+        "Model Parameters": "14.766B",
+        "Chat Template Use": "No"
+    },
+    {
+        "Model Rank": "32",
+        "Icon": "├░┬ñ",
+        "Model Name": "CombinHorizon/Josiefied-abliteratedV4-Qwen2.5-14B-Inst-BaseMerge-TIES",
+        "Average Score": "41.77 %",
+        "IFEval Score": "82.40 %",
+        "BBH Score": "48.20 %",
+        "MATH Score": "53.17 %",
+        "GPQA Score": "9.96 %",
+        "MUSR Score": "12.65 %",
+        "MMLU-PRO Score": "44.21 %",
+        "Model Architecture": "Qwen2ForCausalLM",
+        "Model Precision": "bfloat16",
+        "Model Parameters": "14.77B",
+        "Chat Template Use": "Yes"
+    },
     {
         "rank": 1,
         "name": "suayptalha/Lamarckvergence-14B",