Spaces:

deepseek-ai
/

deepseek-vl2-small

Running on Zero

doubility123 commited on Feb 5

Commit

5c9ea2e

1 Parent(s): 90b258a

add huggingface space mode

Files changed (1) hide show

deepseek_vl2/serve/inference.py CHANGED Viewed

@@ -19,6 +19,7 @@
 from threading import Thread
 from typing import List
 import torch
 import transformers
@@ -40,7 +41,9 @@ def load_model(model_path, dtype=torch.bfloat16):
     vl_gpt: DeepseekVLV2ForCausalLM = AutoModelForCausalLM.from_pretrained(
         model_path, trust_remote_code=True, torch_dtype=dtype
     )
-    vl_gpt = vl_gpt.cuda().eval()
     return tokenizer, vl_gpt, vl_chat_processor
@@ -87,6 +90,7 @@ class StoppingCriteriaSub(StoppingCriteria):
 @torch.inference_mode()
 def deepseek_generate(
     conversations: list,
     vl_gpt: torch.nn.Module,

 from threading import Thread
 from typing import List
+import spaces
 import torch
 import transformers
     vl_gpt: DeepseekVLV2ForCausalLM = AutoModelForCausalLM.from_pretrained(
         model_path, trust_remote_code=True, torch_dtype=dtype
     )
+    if torch.cuda.is_available():
+        vl_gpt = vl_gpt.cuda()
     return tokenizer, vl_gpt, vl_chat_processor
 @torch.inference_mode()
+@spaces.GPU(duration=120)
 def deepseek_generate(
     conversations: list,
     vl_gpt: torch.nn.Module,