Spaces:

PhysicsWallahAI
/

Aryabhata-Demo

Running

pw-ai-research commited on about 1 month ago

Commit

b2dc49a

verified ·

1 Parent(s): 98edea1

Update app.py

Made flash attention true

Files changed (1) hide show

app.py CHANGED Viewed

@@ -10,7 +10,7 @@ import threading
 model_id = "PhysicsWallahAI/Aryabhata-1.0"
 tokenizer = AutoTokenizer.from_pretrained(model_id)
-model = AutoModelForCausalLM.from_pretrained(model_id, torch_dtype="auto", device_map="auto")
 def process_questions(example):
     example["question_text"] = example["question"]

 model_id = "PhysicsWallahAI/Aryabhata-1.0"
 tokenizer = AutoTokenizer.from_pretrained(model_id)
+model = AutoModelForCausalLM.from_pretrained(model_id, torch_dtype="auto", device_map="auto", use_flash_attention_2=True)
 def process_questions(example):
     example["question_text"] = example["question"]