Spaces:

Sakalti
/

Pythia

Sleeping

File size: 2,119 Bytes

bddd52c
 
a19da9e
bddd52c

from transformers import AutoModelForCausalLM, AutoTokenizer
import torch
import gradio as gr

# モデルとトークナイザーの読み込み
def load_model():
    model_name = "EleutherAI/pythia-1b-deduped"
    tokenizer = AutoTokenizer.from_pretrained(model_name)
    model = AutoModelForCausalLM.from_pretrained(model_name)
    return model, tokenizer

model, tokenizer = load_model()

# 応答を生成する関数
def respond(message, history, max_tokens, temperature, top_p):
    # 入力履歴と新しいメッセージを連結
    input_text = ""
    for user_message, bot_response in history:
        input_text += f"User: {user_message}\nAssistant: {bot_response}\n"
    input_text += f"User: {message}\nAssistant:"

    # トークナイズ
    inputs = tokenizer(input_text, return_tensors="pt")

    # モデルによる応答生成
    with torch.no_grad():
        outputs = model.generate(
            inputs.input_ids,
            max_length=inputs.input_ids.shape[1] + max_tokens,
            do_sample=True,
            top_p=top_p,
            temperature=temperature,
        )

    # 応答をデコード
    response = tokenizer.decode(outputs[0], skip_special_tokens=True)
    # 最後のユーザー入力以降の応答部分を抽出
    response = response.split("Assistant:")[-1].strip()

    # 応答と履歴を更新
    history.append((message, response))
    return response, history

# Gradioインターフェースの設定
with gr.Blocks() as demo:
    gr.Markdown("## AIチャット")
    chatbot = gr.Chatbot()
    msg = gr.Textbox(label="あなたのメッセージ")
    max_tokens = gr.Slider(1, 2048, value=512, step=1, label="Max new tokens")
    temperature = gr.Slider(0.1, 4.0, value=0.7, step=0.1, label="Temperature")
    top_p = gr.Slider(0.1, 1.0, value=0.95, step=0.05, label="Top-p (nucleus sampling)")
    clear = gr.Button("クリア")

    def clear_history():
        return [], []

    msg.submit(respond, inputs=[msg, chatbot, max_tokens, temperature, top_p], outputs=[chatbot, chatbot])
    clear.click(clear_history, outputs=[chatbot])

demo.launch()