Spaces:

BenBranyon
/

LongShadow

Running on Zero

BenBranyon commited on Aug 11, 2024

Commit

358b4a9

verified ·

1 Parent(s): aa16eb2

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -13,11 +13,11 @@ DEFAULT_MAX_NEW_TOKENS = 512
 MAX_INPUT_TOKEN_LENGTH = int(os.getenv("MAX_INPUT_TOKEN_LENGTH", "4096"))
 #Inference API Code
-client = InferenceClient("BenBranyon/zephyr-sumbot-all-songs-large")
 #Transformers Code
 if torch.cuda.is_available():
-    model_id = "BenBranyon/zephyr-sumbot-all-songs"
     model = AutoModelForCausalLM.from_pretrained(model_id, device_map="auto")
     tokenizer = AutoTokenizer.from_pretrained(model_id)
     tokenizer.use_default_system_prompt = False

 MAX_INPUT_TOKEN_LENGTH = int(os.getenv("MAX_INPUT_TOKEN_LENGTH", "4096"))
 #Inference API Code
+#client = InferenceClient("BenBranyon/zephyr-sumbot-all-songs-large")
 #Transformers Code
 if torch.cuda.is_available():
+    model_id = "BenBranyon/zephyr-sumbot-all-songs-large"
     model = AutoModelForCausalLM.from_pretrained(model_id, device_map="auto")
     tokenizer = AutoTokenizer.from_pretrained(model_id)
     tokenizer.use_default_system_prompt = False