phi3-mini-4k-instruct-demo

Paused

dwb2023 commited on May 30, 2024

Commit

565f6fc

verified ·

1 Parent(s): 85e5da9

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -12,9 +12,6 @@ from transformers import (
     LlamaTokenizer,
 )
-device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
 MAX_MAX_NEW_TOKENS = 1024
 DEFAULT_MAX_NEW_TOKENS = 50
 MAX_INPUT_TOKEN_LENGTH = 512
@@ -29,7 +26,9 @@ For additional detail on the model, including a link to the arXiv paper, refer t
 model = AutoModelForCausalLM.from_pretrained(
     "microsoft/Phi-3-mini-4k-instruct",
-    trust_remote_code=True,
 )
 tokenizer = AutoTokenizer.from_pretrained("microsoft/Phi-3-mini-4k-instruct")

     LlamaTokenizer,
 )
 MAX_MAX_NEW_TOKENS = 1024
 DEFAULT_MAX_NEW_TOKENS = 50
 MAX_INPUT_TOKEN_LENGTH = 512
 model = AutoModelForCausalLM.from_pretrained(
     "microsoft/Phi-3-mini-4k-instruct",
+    device_map="cuda",
+    torch_dtype="auto",
+    trust_remote_code=True,
 )
 tokenizer = AutoTokenizer.from_pretrained("microsoft/Phi-3-mini-4k-instruct")