from transformers import AutoTokenizer, AutoModelForCausalLM
import torch
import gradio as gr

model_name = "sberbank-ai/rugpt3medium_based_on_gpt2"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForCausalLM.from_pretrained(model_name)

def generate_response(prompt):
    instruction = f"Ответь кратко и ясно на вопрос:\n{prompt.strip()}\nОтвет:"
    input_ids = tokenizer.encode(instruction, return_tensors="pt")

    output = model.generate(
        input_ids,
        max_new_tokens=100,
        do_sample=True,
        top_k=50,
        top_p=0.95,
        temperature=0.9,
        pad_token_id=tokenizer.eos_token_id,
        eos_token_id=tokenizer.eos_token_id
    )

    response = tokenizer.decode(output[0], skip_special_tokens=True)
    
    # Удалим часть промпта из начала
    return response.replace(instruction, "").strip()

iface = gr.Interface(
    fn=generate_response,
    inputs=gr.Textbox(label="Введите ваш вопрос"),
    outputs=gr.Textbox(label="Ответ модели"),
    title="Интерфейс ChatGPT",
    description="Пример взаимодействия с API OpenAI через Hugging Face Space"
)

iface.launch()