Spaces:

cody82
/

bot_innopolis

Runtime error

cody82 commited on 29 days ago

Commit

f49a41a

verified ·

1 Parent(s): 12dd231

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -2,7 +2,7 @@ import torch
 import gradio as gr
 from transformers import AutoTokenizer, AutoModelForSeq2SeqLM
-model_id = "google/flan-t5-base"
 tokenizer = AutoTokenizer.from_pretrained(model_id)
 model = AutoModelForSeq2SeqLM.from_pretrained(model_id)
 device = "cuda" if torch.cuda.is_available() else "cpu"
@@ -12,19 +12,19 @@ def respond(message, history=None):
     if history is None:
         history = []
-    prompt = f"Question: {message} Answer:"
     inputs = tokenizer(prompt, return_tensors="pt").to(device)
     with torch.no_grad():
         outputs = model.generate(
             **inputs,
-            max_new_tokens=50,
             do_sample=False,
             eos_token_id=tokenizer.eos_token_id
         )
     answer = tokenizer.decode(outputs[0], skip_special_tokens=True)
-    # Убираем из ответа префикс prompt, если он остался
     if answer.lower().startswith(prompt.lower()):
         answer = answer[len(prompt):].strip()

 import gradio as gr
 from transformers import AutoTokenizer, AutoModelForSeq2SeqLM
+model_id = "google/flan-t5-base"  # можно попробовать flan-t5-large
 tokenizer = AutoTokenizer.from_pretrained(model_id)
 model = AutoModelForSeq2SeqLM.from_pretrained(model_id)
 device = "cuda" if torch.cuda.is_available() else "cpu"
     if history is None:
         history = []
+    prompt = f"Answer the following question about Innopolis University clearly and concisely.\nQuestion: {message}\nAnswer:"
     inputs = tokenizer(prompt, return_tensors="pt").to(device)
     with torch.no_grad():
         outputs = model.generate(
             **inputs,
+            max_new_tokens=100,
             do_sample=False,
             eos_token_id=tokenizer.eos_token_id
         )
     answer = tokenizer.decode(outputs[0], skip_special_tokens=True)
+    # Отрезаем если модель включила prompt в ответ
     if answer.lower().startswith(prompt.lower()):
         answer = answer[len(prompt):].strip()