Spaces:

analist
/

OmniMed_SIA

Runtime error

analist commited on May 12

Commit

7e39dd0

verified ·

1 Parent(s): 7a9b8aa

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -4,18 +4,17 @@ from transformers import AutoModelForCausalLM, AutoTokenizer, pipeline
 # Définir le modèle et le tokenizer
 # Utilisation d'un modèle français pour le domaine médical
-MODEL_NAME = "mistralai/Mistral-7B-v0.1"  # Vous pouvez utiliser un modèle plus adapté au français comme "camembert" ou un modèle médical spécifique
 # Fonction pour charger le modèle et le tokenizer
 def load_model():
     print("Chargement du modèle et du tokenizer...")
-    tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME)
-    model = AutoModelForCausalLM.from_pretrained(
-        MODEL_NAME,
-        torch_dtype=torch.float16,
-        device_map="auto",
-        load_in_8bit=True  # Quantification pour réduire l'utilisation de la mémoire
-    )
     return model, tokenizer
 # Charger le modèle et le tokenizer

 # Définir le modèle et le tokenizer
 # Utilisation d'un modèle français pour le domaine médical
+MODEL_NAME = "analist/llama3.1-8B-omnimed-rl"  # Vous pouvez utiliser un modèle plus adapté au français comme "camembert" ou un modèle médical spécifique
 # Fonction pour charger le modèle et le tokenizer
 def load_model():
     print("Chargement du modèle et du tokenizer...")
+    model, tokenizer = FastLanguageModel.from_pretrained(
+    model_name = MODEL_NAME,
+    max_seq_length = 8192,
+    load_in_4bit = True,
+    token = "hf_...", # use one if using gated models like meta-llama/Llama-2-7b-hf
+)
     return model, tokenizer
 # Charger le modèle et le tokenizer