Spaces:

cody82
/

bot_innopolis

Sleeping

cody82 commited on Jul 21

Commit

5a42269

verified ·

1 Parent(s): c833cd6

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,24 +1,20 @@
-import gradio as gr
 import torch
 from transformers import AutoTokenizer, AutoModelForSeq2SeqLM
-import spaces  # обязательно для ZeroGPU
-model_name = "google/flan-t5-base"
-tokenizer = AutoTokenizer.from_pretrained(model_name)
-model = AutoModelForSeq2SeqLM.from_pretrained(model_name)
-device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
-model.to(device)
 @spaces.GPU
 def respond(message, history=[]):
     prompt = f"Answer the question: {message}"
-    inputs = tokenizer(prompt, return_tensors="pt").to(device)
-    outputs = model.generate(**inputs, max_new_tokens=100)
-    response = tokenizer.decode(outputs[0], skip_special_tokens=True)
     history.append((message, response))
     return history
-demo = gr.ChatInterface(fn=respond)
-if __name__ == "__main__":
-    demo.launch()

 import torch
+import gradio as gr
 from transformers import AutoTokenizer, AutoModelForSeq2SeqLM
+import spaces
+model_id = "google/flan-t5-base"
+tokenizer = AutoTokenizer.from_pretrained(model_id)
+model = AutoModelForSeq2SeqLM.from_pretrained(model_id)
+model.to("cuda" if torch.cuda.is_available() else "cpu")
 @spaces.GPU
 def respond(message, history=[]):
     prompt = f"Answer the question: {message}"
+    inputs = tokenizer(prompt, return_tensors="pt").to(model.device)
+    output = model.generate(**inputs, max_new_tokens=100)
+    response = tokenizer.decode(output[0], skip_special_tokens=True)
     history.append((message, response))
     return history
+gr.ChatInterface(fn=respond).launch()