pankajmathur
/

model_101

Text Generation

text-generation-inference

Model card Files Files and versions

pankajmathur commited on Nov 9, 2023

Commit

a64eeb1

·

1 Parent(s): 7fde4e7

Update README.md

Files changed (1) hide show

README.md +11 -8

README.md CHANGED Viewed

@@ -53,14 +53,17 @@ We evaluated model_001 on a wide range of tasks using [Language Model Evaluation
 Here are the results on metrics used by [HuggingFaceH4 Open LLM Leaderboard](https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard)
-|||||
-|:------:|:--------:|:-------:|:--------:|
-|**Task**|**Metric**|**Value**|**Stderr**|
-|*arc_challenge*|acc_norm|0.7108|0.0141|
-|*hellaswag*|acc_norm|0.8765|0.0038|
-|*mmlu*|acc_norm|0.6904|0.0351|
-|*truthfulqa_mc*|mc2|0.6312|0.0157|
-|**Total Average**|-|**0.72729**||
 <br>

 Here are the results on metrics used by [HuggingFaceH4 Open LLM Leaderboard](https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard)
+|||
+|:------:|:-------:|
+|**Task**|**Value**|
+|*ARC*|0.6869|
+|*HellaSwag*|0.8642|
+|*MMLU*|0.6992|
+|*TruthfulQA*|0.5885|
+|*Winogrande*|0.8208|
+|*GSM8k*|0.4481|
+|*DROP*|0.5510|
+|**Total Average**|**0.6655**|
 <br>