Spaces:

WesanCZE
/

SDK-python

Sleeping

WesanCZE commited on Mar 6

Commit

f1e5dd5

verified ·

1 Parent(s): e7bbf43

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -2,15 +2,21 @@ import os
 import torch
 from llama_cpp import Llama
 import gradio as gr
-# 🔹 Stáhneme model, pokud není dostupný
 MODEL_NAME = "TheBloke/Mistral-7B-Instruct-GGUF"
 MODEL_FILE = "Mistral-7B-Instruct-Q4_K_M.gguf"
 MODEL_PATH = f"./{MODEL_FILE}"
 if not os.path.exists(MODEL_PATH):
-    from huggingface_hub import hf_hub_download
-    MODEL_PATH = hf_hub_download(repo_id=MODEL_NAME, filename=MODEL_FILE)
 # 🔹 Načteme model do RAM
 llm = Llama(model_path=MODEL_PATH, n_ctx=1024, n_threads=8, verbose=False)

 import torch
 from llama_cpp import Llama
 import gradio as gr
+from huggingface_hub import login, hf_hub_download
+# 🔹 Načteme API token bezpečně ze "Secrets"
+HF_TOKEN = os.getenv("HF_TOKEN")
+# Přihlásíme se k Hugging Face API
+login(HF_TOKEN)
+# 🔹 Stáhneme model
 MODEL_NAME = "TheBloke/Mistral-7B-Instruct-GGUF"
 MODEL_FILE = "Mistral-7B-Instruct-Q4_K_M.gguf"
 MODEL_PATH = f"./{MODEL_FILE}"
 if not os.path.exists(MODEL_PATH):
+    MODEL_PATH = hf_hub_download(repo_id=MODEL_NAME, filename=MODEL_FILE, token=HF_TOKEN)
 # 🔹 Načteme model do RAM
 llm = Llama(model_path=MODEL_PATH, n_ctx=1024, n_threads=8, verbose=False)