Spaces:

yourbench
/

demo

Running on CPU Upgrade

App Files Files Community

tfrere commited on Apr 2

Commit

13efede

1 Parent(s): 00d9f6f

refactor get available model provider

Browse files

Files changed (1) hide show

backend/tasks/get_available_model_provider.py +7 -68

backend/tasks/get_available_model_provider.py CHANGED Viewed

@@ -4,53 +4,19 @@ import json
 from huggingface_hub import model_info, InferenceClient
 from dotenv import load_dotenv
 # Define preferred providers
 PREFERRED_PROVIDERS = ["sambanova", "novita"]
-def filter_providers(providers):
-    """Filter providers to only include preferred ones."""
-    return [provider for provider in providers if provider in PREFERRED_PROVIDERS]
-def prioritize_providers(providers):
-    """Prioritize preferred providers, keeping all others."""
-    preferred = [provider for provider in providers if provider in PREFERRED_PROVIDERS]
-    non_preferred = [provider for provider in providers if provider not in PREFERRED_PROVIDERS]
-    return preferred + non_preferred
 # Configure logging
 logging.basicConfig(level=logging.INFO, format="%(asctime)s - %(levelname)s - %(message)s")
 logger = logging.getLogger(__name__)
-def is_vision_model(model_name: str) -> bool:
-    """
-    Check if the model is a vision model based on its name
-    Args:
-        model_name: Name of the model
-    Returns:
-        True if it's a vision model, False otherwise
-    """
-    vision_indicators = ["-VL-", "vision", "clip", "image"]
-    return any(indicator in model_name.lower() for indicator in vision_indicators)
-def get_test_payload(model_name: str) -> dict:
-    """
-    Get the appropriate test payload based on model type
-    Args:
-        model_name: Name of the model
-    Returns:
-        Dictionary containing the test payload
-    """
-    # We're only testing text models now
-    return {
-        "inputs": "Hello",
-        "parameters": {
-            "max_new_tokens": 5
-        }
-    }
 def test_provider(model_name: str, provider: str, verbose: bool = False) -> bool:
     """
@@ -65,9 +31,6 @@ def test_provider(model_name: str, provider: str, verbose: bool = False) -> bool
         True if the provider is available, False otherwise
     """
     try:
-        # Load environment variables
-        load_dotenv()
         # Get HF token from environment
         hf_token = os.environ.get("HF_TOKEN")
         if not hf_token:
@@ -128,9 +91,6 @@ def get_available_model_provider(model_name, verbose=False):
         First available provider or None if none are available
     """
     try:
-        # Load environment variables
-        load_dotenv()
         # Get HF token from environment
         hf_token = os.environ.get("HF_TOKEN")
         if not hf_token:
@@ -168,23 +128,6 @@ def get_available_model_provider(model_name, verbose=False):
         return None
 if __name__ == "__main__":
-    # # Example usage with verbose mode enabled
-    # model = "Qwen/Qwen2.5-72B-Instruct"
-    # # Test sambanova provider
-    # print("\nTesting sambanova provider:")
-    # sambanova_available = test_provider(model, "sambanova", verbose=True)
-    # print(f"sambanova available: {sambanova_available}")
-    # # Test novita provider
-    # print("\nTesting novita provider:")
-    # novita_available = test_provider(model, "novita", verbose=True)
-    # print(f"novita available: {novita_available}")
-    # # Test automatic provider selection
-    # print("\nTesting automatic provider selection:")
-    # provider = get_available_model_provider(model, verbose=True)
-    # print(f"Selected provider: {provider}")
     models = [
         "Qwen/QwQ-32B",
@@ -201,8 +144,4 @@ if __name__ == "__main__":
         providers.append(provider)
     print(f"Providers {len(providers)}: {providers}")
-    # print("\nTesting novita provider:")
-    # novita_available = test_provider("deepseek-ai/DeepSeek-V3-0324", "novita", verbose=True)
-    # print(f"novita available: {novita_available}")

 from huggingface_hub import model_info, InferenceClient
 from dotenv import load_dotenv
+# Load environment variables once at the module level
+load_dotenv()
 # Define preferred providers
 PREFERRED_PROVIDERS = ["sambanova", "novita"]
 # Configure logging
 logging.basicConfig(level=logging.INFO, format="%(asctime)s - %(levelname)s - %(message)s")
 logger = logging.getLogger(__name__)
+def prioritize_providers(providers):
+    """Prioritize preferred providers, keeping all others."""
+    return sorted(providers, key=lambda provider: provider not in PREFERRED_PROVIDERS)
 def test_provider(model_name: str, provider: str, verbose: bool = False) -> bool:
     """
         True if the provider is available, False otherwise
     """
     try:
         # Get HF token from environment
         hf_token = os.environ.get("HF_TOKEN")
         if not hf_token:
         First available provider or None if none are available
     """
     try:
         # Get HF token from environment
         hf_token = os.environ.get("HF_TOKEN")
         if not hf_token:
         return None
 if __name__ == "__main__":
     models = [
         "Qwen/QwQ-32B",
         providers.append(provider)
     print(f"Providers {len(providers)}: {providers}")