Spaces:

analist
/

OmniMed_SIA

Runtime error

analist commited on May 11

Commit

9f45c43

verified ·

1 Parent(s): a778934

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -15,22 +15,18 @@ TOP_P = 0.9
 REPETITION_PENALTY = 1.1
 # Chargement du modèle et du tokenizer
-@gr.on_startup
-def load_model():
-    print("Chargement du modèle et du tokenizer...")
-    model = AutoModelForCausalLM.from_pretrained(
-        MODEL_NAME,
-        torch_dtype=torch.float16,
-        device_map="auto",
-        trust_remote_code=True
-    )
-    tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME)
-    print("Modèle et tokenizer chargés avec succès!")
-    return model, tokenizer
 # Fonction pour générer une réponse
 def generate_response(message, chat_history, system_prompt, temperature=TEMPERATURE, max_tokens=MAX_NEW_TOKENS):
-    model, tokenizer = load_model.value
     # Construction du contexte de chat
     chat_context = []

 REPETITION_PENALTY = 1.1
 # Chargement du modèle et du tokenizer
+print("Chargement du modèle et du tokenizer...")
+model = AutoModelForCausalLM.from_pretrained(
+    MODEL_NAME,
+    torch_dtype=torch.float16,
+    device_map="auto",
+    trust_remote_code=True
+)
+tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME)
+print("Modèle et tokenizer chargés avec succès!")
 # Fonction pour générer une réponse
 def generate_response(message, chat_history, system_prompt, temperature=TEMPERATURE, max_tokens=MAX_NEW_TOKENS):
     # Construction du contexte de chat
     chat_context = []