Spaces:

mgbam
/

builder

Running

App Files Files Community

mgbam commited on 24 days ago

Commit

034cea3

verified ·

1 Parent(s): f70a193

Update hf_client.py

Browse files

Files changed (1) hide show

hf_client.py +18 -44

hf_client.py CHANGED Viewed

@@ -1,60 +1,34 @@
 # hf_client.py
 import os
-from typing import Optional
-from huggingface_hub import InferenceClient
 from tavily import TavilyClient
-# Supported billing targets
-_VALID_BILL_TO = {"huggingface", "fairworksai", "groq", "openai", "gemini", "fireworks", "googler"}
-# Load Hugging Face token
-HF_TOKEN = os.getenv("HF_TOKEN")
 if not HF_TOKEN:
     raise RuntimeError(
-        "HF_TOKEN environment variable is not set. "
-        "Please set it to your Hugging Face API token."
     )
-# Initialize Tavily search client (optional)
-TAVILY_API_KEY = os.getenv('TAVILY_API_KEY')
-tavily_client: Optional[TavilyClient] = None
-if TAVILY_API_KEY:
-    try:
-        tavily_client = TavilyClient(api_key=TAVILY_API_KEY)
-    except Exception as e:
-        print(f"Failed to initialize Tavily client: {e}")
-        tavily_client = None
 def get_inference_client(model_id: str, provider: str = "auto") -> InferenceClient:
-    """
-    Configure InferenceClient based on model_id prefixes:
-      - moonshotai/Kimi-K2-Instruct → provider "groq"
-      - openai/... or GPT names       → provider "openai"
-      - gemini/... or google/...     → provider "gemini"
-      - fireworks/...                → provider "fireworks"
-      - otherwise                     → use HF Inference provider (auto)
-    Bill to the chosen provider if valid; otherwise, default to "groq".
-    """
-    # Override provider by model
     if model_id == "moonshotai/Kimi-K2-Instruct":
         provider = "groq"
-    elif model_id.startswith("openai/") or model_id in {"gpt-4", "gpt-3.5-turbo"}:
-        provider = "openai"
-    elif model_id.startswith("gemini/") or model_id.startswith("google/"):
-        provider = "gemini"
-    elif model_id.startswith("fireworks/"):
-        provider = "fireworks"
-    else:
-        # For Hugging Face models, let HF Inference pick best provider
-        provider = "auto"
-    # Determine billing target
-    bill_to = provider if provider in _VALID_BILL_TO else "groq"
     return InferenceClient(
         provider=provider,
         api_key=HF_TOKEN,
-        bill_to=bill_to
     )

+```python
 # hf_client.py
 import os
+from huggingface_hub import InferenceClient, HfApi
 from tavily import TavilyClient
+# HF Inference Client
+HF_TOKEN = os.getenv('HF_TOKEN')
 if not HF_TOKEN:
     raise RuntimeError(
+        "HF_TOKEN environment variable is not set. Please set it to your Hugging Face API token."
     )
 def get_inference_client(model_id: str, provider: str = "auto") -> InferenceClient:
+    """Return an InferenceClient with the appropriate provider."""
     if model_id == "moonshotai/Kimi-K2-Instruct":
         provider = "groq"
     return InferenceClient(
         provider=provider,
         api_key=HF_TOKEN,
+        bill_to="my-org-name"
     )
+# Tavily Search Client
+TAVILY_API_KEY = os.getenv('TAVILY_API_KEY')
+tavily_client = None
+if TAVILY_API_KEY:
+    try:
+        tavily_client = TavilyClient(api_key=TAVILY_API_KEY)
+    except Exception as e:
+        print(f"Failed to initialize Tavily client: {e}")
+        tavily_client = None