Spaces:

MBZUAI-LLM
/

Mobile-MMLU-Challenge

Running

SondosMB commited on Dec 20, 2024

Commit

2f1a209

verified ·

1 Parent(s): c7961fd

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -203,20 +203,27 @@ def clean_answer(answer):
     return clean[0].upper() if clean else None
 def update_leaderboard(results):
     try:
-        new_entry = {
-            "Model Name": results['model_name'],
-            "Overall Accuracy": round(results['overall_accuracy'] * 100, 2),
-            "Valid Accuracy": round(results['valid_accuracy'] * 100, 2),
-            "Correct Predictions": results['correct_predictions'],
-            "Total Questions": results['total_questions'],
-            "Timestamp": datetime.now().strftime("%Y-%m-%d %H:%M:%S"),
-        }
         new_entry_df = pd.DataFrame([new_entry])
-        new_entry_df.to_csv(LEADERBOARD_FILE, mode='a', index=False, header=not os.path.exists(LEADERBOARD_FILE))
-        print("Leaderboard updated successfully!")
     except Exception as e:
-        print(f"Error while updating leaderboard: {e}")
 def load_leaderboard():
@@ -274,6 +281,7 @@ def evaluate_predictions(prediction_file, model_name, add_to_leaderboard):
             return "Evaluation completed and added to leaderboard.", load_leaderboard()
         else:
             return "Evaluation completed but not added to leaderboard.", load_leaderboard()
     except Exception as e:
         return f"Error during evaluation: {str(e)}", load_leaderboard()

     return clean[0].upper() if clean else None
 def update_leaderboard(results):
+    new_entry = {
+        "Model Name": results['model_name'],
+        "Overall Accuracy": round(results['overall_accuracy'] * 100, 2),
+        "Valid Accuracy": round(results['valid_accuracy'] * 100, 2),
+        "Correct Predictions": results['correct_predictions'],
+        "Total Questions": results['total_questions'],
+        "Timestamp": datetime.now().strftime("%Y-%m-%d %H:%M:%S"),
+    }
     try:
         new_entry_df = pd.DataFrame([new_entry])
+        new_entry_df.to_csv(
+            LEADERBOARD_FILE,
+            mode='a',  # Append mode
+            index=False,
+            header=not os.path.exists(LEADERBOARD_FILE)  # Add headers if file doesn't exist
+        )
+        print("Leaderboard file updated successfully.")
     except Exception as e:
+        print(f"Error writing to leaderboard file: {e}")
 def load_leaderboard():
             return "Evaluation completed and added to leaderboard.", load_leaderboard()
         else:
             return "Evaluation completed but not added to leaderboard.", load_leaderboard()
     except Exception as e:
         return f"Error during evaluation: {str(e)}", load_leaderboard()