Spaces:
Running
on
CPU Upgrade
Running
on
CPU Upgrade
File size: 12,039 Bytes
aae1c13 c4411e8 aae1c13 |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223 224 225 226 227 228 229 230 231 232 233 234 235 236 237 238 239 240 241 242 243 244 245 246 247 248 249 250 251 252 253 254 255 256 257 258 259 260 261 262 263 264 265 266 267 268 269 270 271 272 273 274 275 276 277 278 279 280 281 282 |
#!/usr/bin/env python3
# -*- coding: utf-8 -*-
"""
Script standalone pour vérifier et afficher les propriétés d'un token Hugging Face.
Ce script peut être exécuté séparément pour diagnostiquer les problèmes d'authentification.
"""
import os
import sys
import json
import requests
from datetime import datetime
from dotenv import load_dotenv
from argparse import ArgumentParser
def color_text(text, color_code):
"""Format text with color for terminal output."""
return f"\033[{color_code}m{text}\033[0m"
def success(text):
"""Format text as success message (green)."""
return color_text(f"✅ {text}", "92")
def warning(text):
"""Format text as warning message (yellow)."""
return color_text(f"⚠️ {text}", "93")
def error(text):
"""Format text as error message (red)."""
return color_text(f"❌ {text}", "91")
def info(text):
"""Format text as info message (blue)."""
return color_text(f"ℹ️ {text}", "94")
def check_token_via_inference_api(token=None, verbose=True):
"""
Vérifie la validité d'un token HF en testant directement l'API d'inférence.
L'API whoami ne fonctionne pas toujours correctement pour les tokens mais l'API d'inférence
est la priorité dans notre application.
Args:
token: Le token à vérifier
verbose: Afficher des informations détaillées
Returns:
dict: Résultats de la vérification
"""
results = {
"is_valid": False,
"token": None,
"error_message": None,
"can_access_inference": False
}
# 1. Obtenir le token
if token is None:
token = os.environ.get("HF_TOKEN")
if not token:
print(error("Aucun token trouvé. Veuillez spécifier un token avec --token ou définir la variable d'environnement HF_TOKEN."))
results["error_message"] = "No token provided"
return results
# Ne montrer aucun caractère du token, juste indiquer sa présence
masked_token = "••••••••••"
results["token"] = masked_token
print(info(f"Token à vérifier: {masked_token}"))
# 2. Vérifier le format basique
if not token.startswith("hf_"):
print(warning("Le token ne commence pas par 'hf_' ce qui est inhabituel. Vérifiez son format."))
else:
print(success("Format du token valide (commence par 'hf_')"))
# 3. Tester l'API d'inférence directement - méthode recommandée pour valider un token
try:
# Test avec un modèle public simple
test_model = "gpt2"
api_url = f"https://api-inference.huggingface.co/models/{test_model}"
print(info(f"Test du token avec l'API d'inférence sur le modèle public {test_model}..."))
headers = {"Authorization": f"Bearer {token}"}
payload = {"inputs": "Hello, how are you?"}
response = requests.post(api_url, headers=headers, json=payload, timeout=10)
if response.status_code in [200, 503]: # 503 signifie que le modèle est en cours de chargement, mais le token est valide
print(success(f"Token valide pour l'API d'inférence! Status code: {response.status_code}"))
if response.status_code == 503:
print(info("Le modèle est en cours de chargement. Le token a bien été accepté par l'API."))
results["is_valid"] = True
results["can_access_inference"] = True
if verbose and response.status_code == 200:
print(info("Résultat de l'inférence:"))
print(json.dumps(response.json(), indent=2))
else:
print(error(f"Échec du test de l'API d'inférence. Status code: {response.status_code}"))
results["error_message"] = response.text
try:
error_data = response.json()
if "error" in error_data:
print(error(f"Message d'erreur: {error_data['error']}"))
results["error_message"] = error_data['error']
except:
print(error(f"Message d'erreur: {response.text}"))
# En cas d'échec, tester aussi l'endpoint de liste des modèles
try:
print(info("Test alternatif avec la liste des modèles déployés..."))
list_url = "https://api-inference.huggingface.co/status"
list_response = requests.get(list_url, headers=headers, timeout=10)
if list_response.status_code == 200:
print(success("Le token peut accéder à la liste des modèles déployés"))
results["can_access_inference"] = True
results["is_valid"] = True
else:
print(error(f"Échec de l'accès à la liste des modèles. Status code: {list_response.status_code}"))
except Exception as e:
print(error(f"Erreur lors du test alternatif: {str(e)}"))
except Exception as e:
print(error(f"Erreur lors du test de l'API d'inférence: {str(e)}"))
results["error_message"] = str(e)
# 4. Tests supplémentaires des permissions
if results["is_valid"]:
try:
print(info("\nTest des permissions du token..."))
# Tester si on peut accéder aux modèles privés de l'organisation
if os.environ.get("HF_ORGANIZATION"):
org = os.environ.get("HF_ORGANIZATION")
print(info(f"Test d'accès aux modèles de l'organisation {org}..."))
# On regarde juste si on peut accéder à la liste des modèles de l'organisation
org_url = f"https://huggingface.co/api/models?author={org}"
org_response = requests.get(org_url, headers=headers, timeout=10)
if org_response.status_code == 200:
print(success(f"Accès autorisé aux modèles de l'organisation {org}"))
else:
print(warning(f"Le token n'a pas accès aux modèles de l'organisation {org}"))
except Exception as e:
print(error(f"Erreur lors du test des permissions: {str(e)}"))
return results
def check_model_access(token, model, verbose=False):
"""
Vérifie si le token a accès à un modèle spécifique.
Args:
token: Token HF à vérifier
model: Nom du modèle à tester
verbose: Afficher des informations détaillées
Returns:
bool: True si le modèle est accessible, False sinon
"""
print(f"\n" + info(f"Test d'accès au modèle: {model}"))
headers = {
"Authorization": f"Bearer {token}"
}
# 1. Vérifier si le modèle existe et est accessible via l'API d'inférence
try:
api_url = f"https://api-inference.huggingface.co/models/{model}"
payload = {"inputs": "Hello, test access"}
print(info(f"Test d'accès à l'API d'inférence pour {model}..."))
response = requests.post(api_url, headers=headers, json=payload, timeout=20)
if response.status_code in [200, 503]: # 503 = modèle en cours de chargement, mais le token est valide
if response.status_code == 200:
print(success(f"Accès réussi à l'API d'inférence pour {model}"))
return True
else:
print(success(f"Accès autorisé pour {model} (modèle en cours de chargement)"))
return True
else:
error_message = "Unknown error"
try:
error_data = response.json()
if "error" in error_data:
error_message = error_data["error"]
except:
error_message = response.text
print(error(f"Échec d'accès à l'API d'inférence pour {model}: {response.status_code}"))
print(error(f"Message: {error_message}"))
# Analyse de l'erreur
if "quota" in error_message.lower() or "rate" in error_message.lower():
print(warning("Possible problème de quota ou de limite de taux"))
elif "loading" in error_message.lower():
print(info("Le modèle est en cours de chargement - réessayez plus tard"))
return True # Considérer comme un succès car le token est accepté
elif "permission" in error_message.lower() or "access" in error_message.lower():
print(error("Problème de permissions - vous n'avez pas accès à ce modèle"))
# Faire un test alternatif via l'API du Hub
try:
print(info(f"Test alternatif via l'API du Hub pour {model}..."))
hub_url = f"https://huggingface.co/api/models/{model}"
hub_response = requests.get(hub_url, headers=headers, timeout=10)
if hub_response.status_code == 200:
print(warning(f"Le modèle {model} existe et est accessible via l'API Hub, mais pas via l'API d'inférence"))
print(info("Cela peut être dû à des restrictions sur le modèle ou à des problèmes temporaires de l'API"))
if verbose:
model_info = hub_response.json()
if model_info.get("private", False):
print(info("Ce modèle est privé"))
if model_info.get("gated", False):
print(info("Ce modèle est à accès restreint (gated)"))
else:
print(error(f"Le modèle {model} n'est pas accessible via l'API Hub non plus: {hub_response.status_code}"))
except Exception as e:
print(error(f"Erreur lors du test alternatif: {str(e)}"))
return False
except Exception as e:
print(error(f"Erreur lors du test d'accès au modèle: {str(e)}"))
return False
def main():
parser = ArgumentParser(description="Vérifiez les propriétés d'un token Hugging Face")
parser.add_argument("--token", type=str, help="Token Hugging Face à vérifier (si non spécifié, utilise HF_TOKEN)")
parser.add_argument("--verbose", "-v", action="store_true", help="Afficher des informations détaillées")
parser.add_argument("--test-model", "-m", type=str, help="Tester l'accès à un modèle spécifique")
parser.add_argument("--test-premium", action="store_true", help="Tester l'accès aux modèles premium courants")
args = parser.parse_args()
# Charger les variables d'environnement
load_dotenv()
print(info(f"=== Vérification de Token Hugging Face - {datetime.now().strftime('%Y-%m-%d %H:%M:%S')} ===\n"))
# Vérifier le token via l'API d'inférence directement
token = args.token or os.environ.get("HF_TOKEN")
token_info = check_token_via_inference_api(token, args.verbose)
# Si le token est valide et qu'on a demandé de tester un modèle
if token_info["is_valid"]:
if args.test_model:
check_model_access(token, args.test_model, args.verbose)
if args.test_premium:
print("\n" + info("=== Test d'accès aux modèles premium ==="))
premium_models = [
"meta-llama/Llama-3.3-70B-Instruct",
"mistralai/Mistral-Small-24B-Instruct-2501",
"deepseek-ai/DeepSeek-R1-Distill-Llama-70B"
]
for model in premium_models:
result = check_model_access(token, model, args.verbose)
print(info(f"Résultat pour {model}: {success('Accessible') if result else error('Non accessible')}"))
print("-" * 50)
if __name__ == "__main__":
main() |