Spaces:

yourbench
/

demo

Running on CPU Upgrade

App Files Files Community

tfrere commited on Apr 7

Commit

4759fe1

1 Parent(s): 5af2380

update model handling in benchmark generation

Browse files

Files changed (2) hide show

backend/main.py +10 -0
backend/tasks/get_available_model_provider.py +82 -18

backend/main.py CHANGED Viewed

@@ -3,6 +3,7 @@ from fastapi.middleware.cors import CORSMiddleware
 import os
 from dotenv import load_dotenv
 from routes import routers, session_files, active_tasks, benchmark
 # Load environment variables from .env file
 load_dotenv()
@@ -32,6 +33,15 @@ app.add_middleware(
 async def startup_event():
     print("Application startup")
     print(f"Initial session_files: {session_files}")
 # Enregistrer toutes les routes
 for router in routers:

 import os
 from dotenv import load_dotenv
 from routes import routers, session_files, active_tasks, benchmark
+from tasks.get_available_model_provider import test_models
 # Load environment variables from .env file
 load_dotenv()
 async def startup_event():
     print("Application startup")
     print(f"Initial session_files: {session_files}")
+    # Tester les modèles au démarrage et afficher les résultats
+    print("===== Testing model availability at startup =====")
+    test_results = test_models(verbose=True)
+    print("===== Model testing completed =====")
+    if test_results["working_model"]:
+        print(f"✅ Found working model: {test_results['working_model']} with provider: {test_results['provider']}")
+    else:
+        print("❌ WARNING: No working models found. The application might not function correctly!")
 # Enregistrer toutes les routes
 for router in routers:

backend/tasks/get_available_model_provider.py CHANGED Viewed

@@ -3,7 +3,7 @@ import logging
 import json
 from huggingface_hub import model_info, InferenceClient
 from dotenv import load_dotenv
-from config.models_config import PREFERRED_PROVIDERS
 # Load environment variables once at the module level
 load_dotenv()
@@ -30,6 +30,9 @@ def test_provider(model_name: str, provider: str, verbose: bool = False) -> bool
     """
     try:
         # Get HF token from environment
         hf_token = os.environ.get("HF_TOKEN")
         if not hf_token:
@@ -177,32 +180,93 @@ def get_available_model_provider(model_name, verbose=False):
             logger.error(f"Error in get_available_model_provider: {str(e)}")
         return None
-if __name__ == "__main__":
     models = [
         "Qwen/QwQ-32B",
         "Qwen/Qwen2.5-72B-Instruct",
         "meta-llama/Llama-3.3-70B-Instruct",
         "deepseek-ai/DeepSeek-R1-Distill-Llama-70B",
         "mistralai/Mistral-Small-24B-Instruct-2501",
-        "meta-llama/Llama-3.1-8B-Instruct",
-        "Qwen/Qwen2.5-32B-Instruct"
     ]
-    providers = []
-    unavailable_models = []
     for model in models:
-        provider = get_available_model_provider(model, verbose=True)
         if provider:
-            providers.append((model, provider))
         else:
-            unavailable_models.append(model)
-    for model, provider in providers:
-        print(f"Model: {model}, Provider: {provider}")
-    if unavailable_models:
-        print(f"Models with no available providers: {', '.join(unavailable_models)}")
-    print(f"Total Providers {len(providers)}: {providers}")

 import json
 from huggingface_hub import model_info, InferenceClient
 from dotenv import load_dotenv
+from config.models_config import PREFERRED_PROVIDERS, DEFAULT_BENCHMARK_MODEL, ALTERNATIVE_BENCHMARK_MODELS
 # Load environment variables once at the module level
 load_dotenv()
     """
     try:
+        load_dotenv()
         # Get HF token from environment
         hf_token = os.environ.get("HF_TOKEN")
         if not hf_token:
             logger.error(f"Error in get_available_model_provider: {str(e)}")
         return None
+def test_models(verbose=True):
+    """
+    Test le modèle par défaut et les modèles alternatifs, puis retourne un résumé des résultats.
+    Args:
+        verbose: Afficher les logs détaillés
+    Returns:
+        Un dictionnaire avec les résultats des tests
+    """
+    results = {
+        "default_model": None,
+        "working_model": None,
+        "provider": None,
+        "all_models": {},
+        "available_models": [],
+        "unavailable_models": []
+    }
+    if verbose:
+        print(f"Testing main default model: {DEFAULT_BENCHMARK_MODEL}")
+    # Test du modèle par défaut
+    provider = get_available_model_provider(DEFAULT_BENCHMARK_MODEL, verbose=verbose)
+    if provider:
+        if verbose:
+            print(f"\n✅ SUCCESS: Found provider for default model {DEFAULT_BENCHMARK_MODEL}: {provider}")
+        results["default_model"] = DEFAULT_BENCHMARK_MODEL
+        results["working_model"] = DEFAULT_BENCHMARK_MODEL
+        results["provider"] = provider
+    else:
+        if verbose:
+            print(f"\n❌ DEFAULT MODEL FAILED: No provider found for {DEFAULT_BENCHMARK_MODEL}")
+            print("Trying alternative models...")
+        # Essayer les modèles alternatifs
+        for alt_model in ALTERNATIVE_BENCHMARK_MODELS:
+            if verbose:
+                print(f"\nTrying alternative model: {alt_model}")
+            alt_provider = get_available_model_provider(alt_model, verbose=verbose)
+            if alt_provider:
+                if verbose:
+                    print(f"\n✅ SUCCESS: Found provider for alternative model {alt_model}: {alt_provider}")
+                results["working_model"] = alt_model
+                results["provider"] = alt_provider
+                break
+            elif verbose:
+                print(f"❌ Failed to find provider for alternative model: {alt_model}")
+        else:
+            if verbose:
+                print("\n❌ ALL MODELS FAILED: No provider found for any model")
+    # Tester tous les modèles pour avoir une vue d'ensemble
     models = [
         "Qwen/QwQ-32B",
         "Qwen/Qwen2.5-72B-Instruct",
+        "Qwen/Qwen2.5-32B-Instruct",
+        "meta-llama/Llama-3.1-8B-Instruct",
         "meta-llama/Llama-3.3-70B-Instruct",
         "deepseek-ai/DeepSeek-R1-Distill-Llama-70B",
         "mistralai/Mistral-Small-24B-Instruct-2501",
     ]
+    if verbose:
+        print("\n=== Testing all available models ===")
     for model in models:
+        provider = get_available_model_provider(model, verbose)
+        results["all_models"][model] = provider
         if provider:
+            results["available_models"].append((model, provider))
         else:
+            results["unavailable_models"].append(model)
+    if verbose:
+        print("\n=== Results Summary ===")
+        for model, provider in results["available_models"]:
+            print(f"Model: {model}, Provider: {provider}")
+        if results["unavailable_models"]:
+            print(f"Models with no available providers: {', '.join(results['unavailable_models'])}")
+        print(f"Total Available Models: {len(results['available_models'])}")
+    return results
+if __name__ == "__main__":
+    # Exécuter le test si le script est lancé directement
+    test_results = test_models(verbose=True)