Adding the Open Portuguese LLM Leaderboard Evaluation Results

This is an automated PR created with https://huggingface.co/spaces/eduagarcia-temp/portuguese-leaderboard-results-to-modelcard

The purpose of this PR is to add evaluation results from the [🚀 Open Portuguese LLM Leaderboard](https://huggingface.co/spaces/eduagarcia/open_pt_llm_leaderboard) to your model card.

If you encounter any issues, please report them to https://huggingface.co/spaces/eduagarcia-temp/portuguese-leaderboard-results-to-modelcard/discussions

Files changed (1) hide show

README.md +19 -1

README.md CHANGED Viewed

@@ -13,9 +13,9 @@ tags:
 - preference
 - ultrafeedback
 - moe
 datasets:
 - argilla/ultrafeedback-binarized-preferences-cleaned
-base_model: mistralai/Mixtral-8x7B-Instruct-v0.1
 pipeline_tag: text-generation
 model-index:
 - name: notux-8x7b-v1
@@ -108,3 +108,21 @@ Detailed results can be found [here](https://huggingface.co/datasets/open-llm-le
 |Winogrande (5-shot)              |81.61|
 |GSM8k (5-shot)                   |61.64|

 - preference
 - ultrafeedback
 - moe
+base_model: mistralai/Mixtral-8x7B-Instruct-v0.1
 datasets:
 - argilla/ultrafeedback-binarized-preferences-cleaned
 pipeline_tag: text-generation
 model-index:
 - name: notux-8x7b-v1
 |Winogrande (5-shot)              |81.61|
 |GSM8k (5-shot)                   |61.64|
+# Open Portuguese LLM Leaderboard Evaluation Results
+Detailed results can be found [here](https://huggingface.co/datasets/eduagarcia-temp/llm_pt_leaderboard_raw_results/tree/main/argilla/notux-8x7b-v1) and on the [🚀 Open Portuguese LLM Leaderboard](https://huggingface.co/spaces/eduagarcia/open_pt_llm_leaderboard)
+|          Metric          | Value  |
+|--------------------------|--------|
+|Average                   |**73.1**|
+|ENEM Challenge (No Images)|   70.96|
+|BLUEX (No Images)         |   60.22|
+|OAB Exams                 |   49.52|
+|Assin2 RTE                |   92.66|
+|Assin2 STS                |   82.40|
+|FaQuAD NLI                |   79.85|
+|HateBR Binary             |   77.91|
+|PT Hate Speech Binary     |   73.30|
+|tweetSentBR               |   71.08|