Spaces:

PhysicsWallahAI
/

Aryabhata-Demo

Running

pw-ai-research commited on 24 days ago

Commit

99566a2

verified ·

1 Parent(s): db1f4a2

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,3 +1,6 @@
 import gradio as gr
 import transformers
 from transformers import AutoTokenizer, AutoModelForCausalLM, TextIteratorStreamer
@@ -9,7 +12,7 @@ import threading
 model_id = "PhysicsWallahAI/Aryabhata-1.0"
 tokenizer = AutoTokenizer.from_pretrained(model_id)
-model = AutoModelForCausalLM.from_pretrained(model_id, torch_dtype="auto", device_map="auto")
 def process_questions(example):
     example["question_text"] = example["question"]

+import os
+os.system("pip install flash-attn --no-build-isolation")
 import gradio as gr
 import transformers
 from transformers import AutoTokenizer, AutoModelForCausalLM, TextIteratorStreamer
 model_id = "PhysicsWallahAI/Aryabhata-1.0"
 tokenizer = AutoTokenizer.from_pretrained(model_id)
+model = AutoModelForCausalLM.from_pretrained(model_id, torch_dtype="auto", device_map="auto", use_flash_attention=True)
 def process_questions(example):
     example["question_text"] = example["question"]