Spaces:

shivrajkarewar
/

MaterialScienceGPT

Sleeping

shivrajkarewar commited on Apr 13

Commit

b494df4

verified ·

1 Parent(s): dc1de0c

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -7,21 +7,26 @@ from transformers import (
 from threading import Thread
 # Configuration
-MODEL_NAME = "deepseek-ai/DeepSeek-R1"  # Verify exact model ID on Hugging Face Hub
 DEFAULT_MAX_NEW_TOKENS = 512
-# Load model and tokenizer
 try:
-    tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME)
     model = AutoModelForCausalLM.from_pretrained(
         MODEL_NAME,
         device_map="auto",
         torch_dtype="auto",
-        # load_in_4bit=True  # Uncomment for 4-bit quantization
     )
 except Exception as e:
     raise gr.Error(f"Error loading model: {str(e)}")
 def generate_text(prompt, max_new_tokens=DEFAULT_MAX_NEW_TOKENS, temperature=0.7, top_p=0.9):
     inputs = tokenizer(prompt, return_tensors="pt").to(model.device)

 from threading import Thread
 # Configuration
+MODEL_NAME = "deepseek-ai/DeepSeek-R1"
 DEFAULT_MAX_NEW_TOKENS = 512
+# Load model and tokenizer WITH TRUSTED CODE
 try:
+    tokenizer = AutoTokenizer.from_pretrained(
+        MODEL_NAME,
+        trust_remote_code=True  # <-- ADDED HERE
+    )
     model = AutoModelForCausalLM.from_pretrained(
         MODEL_NAME,
         device_map="auto",
         torch_dtype="auto",
+        trust_remote_code=True,  # <-- ADDED HERE
+        # load_in_4bit=True  # Uncomment for quantization
     )
 except Exception as e:
     raise gr.Error(f"Error loading model: {str(e)}")
 def generate_text(prompt, max_new_tokens=DEFAULT_MAX_NEW_TOKENS, temperature=0.7, top_p=0.9):
     inputs = tokenizer(prompt, return_tensors="pt").to(model.device)