Spaces:

cody82
/

bot_innopolis

Running

cody82 commited on Jul 21

Commit

9ba4eae

verified ·

1 Parent(s): 5a42269

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,20 +1,31 @@
 import torch
 import gradio as gr
 from transformers import AutoTokenizer, AutoModelForSeq2SeqLM
-import spaces
 model_id = "google/flan-t5-base"
 tokenizer = AutoTokenizer.from_pretrained(model_id)
 model = AutoModelForSeq2SeqLM.from_pretrained(model_id)
-model.to("cuda" if torch.cuda.is_available() else "cpu")
-@spaces.GPU
 def respond(message, history=[]):
-    prompt = f"Answer the question: {message}"
-    inputs = tokenizer(prompt, return_tensors="pt").to(model.device)
-    output = model.generate(**inputs, max_new_tokens=100)
-    response = tokenizer.decode(output[0], skip_special_tokens=True)
-    history.append((message, response))
     return history
-gr.ChatInterface(fn=respond).launch()

 import torch
 import gradio as gr
 from transformers import AutoTokenizer, AutoModelForSeq2SeqLM
 model_id = "google/flan-t5-base"
 tokenizer = AutoTokenizer.from_pretrained(model_id)
 model = AutoModelForSeq2SeqLM.from_pretrained(model_id)
+device = "cuda" if torch.cuda.is_available() else "cpu"
+model.to(device)
 def respond(message, history=[]):
+    prompt = f"Question: {message} Answer:"
+    inputs = tokenizer(prompt, return_tensors="pt").to(device)
+    with torch.no_grad():
+        outputs = model.generate(
+            **inputs,
+            max_new_tokens=50,
+            do_sample=False,
+            eos_token_id=tokenizer.eos_token_id
+        )
+    answer = tokenizer.decode(outputs[0], skip_special_tokens=True)
+    # Убираем из ответа префикс prompt, если он остался
+    if answer.lower().startswith(prompt.lower()):
+        answer = answer[len(prompt):].strip()
+    history.append((message, answer))
     return history
+iface = gr.ChatInterface(fn=respond, title="Innopolis Q&A")
+iface.launch()