H2H-eval-comparator

Sleeping

rohansampath commited on Feb 13

Commit

c69128a

verified ·

1 Parent(s): 3f6f5f7

Update mmlu_eval.py

Files changed (1) hide show

mmlu_eval.py CHANGED Viewed

@@ -3,6 +3,7 @@ import random
 import evaluate
 from datasets import load_dataset
 from transformers import AutoTokenizer, AutoModelForCausalLM
 # Load Accuracy Metric
 accuracy_metric = evaluate.load("accuracy")
@@ -10,6 +11,7 @@ accuracy_metric = evaluate.load("accuracy")
 # Load MMLU dataset
 mmlu_dataset = load_dataset("cais/mmlu", "all")
 def generate_answer(model, tokenizer, question):
     """
     Generates an answer using Mistral's instruction format.

 import evaluate
 from datasets import load_dataset
 from transformers import AutoTokenizer, AutoModelForCausalLM
+import spaces
 # Load Accuracy Metric
 accuracy_metric = evaluate.load("accuracy")
 # Load MMLU dataset
 mmlu_dataset = load_dataset("cais/mmlu", "all")
+@spaces.GPU
 def generate_answer(model, tokenizer, question):
     """
     Generates an answer using Mistral's instruction format.