Spaces:

cody82
/

bot_innopolis

Running

File size: 1,217 Bytes

e27ef48
5a42269
c833cd6
e474e6b
f49a41a
5a42269
 
9ba4eae
 
e474e6b
12dd231
 
 
 
f49a41a
9ba4eae
 
 
 
 
f49a41a
9ba4eae
 
 
 
12dd231
f49a41a
9ba4eae
 
 
 
d950da6
e474e6b
9ba4eae

import torch
import gradio as gr
from transformers import AutoTokenizer, AutoModelForSeq2SeqLM

model_id = "google/flan-t5-base"  # можно попробовать flan-t5-large
tokenizer = AutoTokenizer.from_pretrained(model_id)
model = AutoModelForSeq2SeqLM.from_pretrained(model_id)
device = "cuda" if torch.cuda.is_available() else "cpu"
model.to(device)

def respond(message, history=None):
    if history is None:
        history = []

    prompt = f"Answer the following question about Innopolis University clearly and concisely.\nQuestion: {message}\nAnswer:"
    inputs = tokenizer(prompt, return_tensors="pt").to(device)

    with torch.no_grad():
        outputs = model.generate(
            **inputs,
            max_new_tokens=100,
            do_sample=False,
            eos_token_id=tokenizer.eos_token_id
        )
    answer = tokenizer.decode(outputs[0], skip_special_tokens=True)

    # Отрезаем если модель включила prompt в ответ
    if answer.lower().startswith(prompt.lower()):
        answer = answer[len(prompt):].strip()

    history.append((message, answer))
    return history

iface = gr.ChatInterface(fn=respond, title="Innopolis Q&A")
iface.launch()