|
import gradio as gr
|
|
from transformers import GPT2Tokenizer, GPT2LMHeadModel
|
|
import torch
|
|
|
|
|
|
tokenizer = GPT2Tokenizer.from_pretrained('modelo_treinado')
|
|
model = GPT2LMHeadModel.from_pretrained('modelo_treinado')
|
|
|
|
|
|
device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
|
|
model.to(device)
|
|
|
|
|
|
def gerar_nota_release(feature_description_prompt, max_new_tokens=50, num_return_sequences=1):
|
|
|
|
template = """É hora de atualizar o seu íon Itaú.
|
|
{}
|
|
Atualize o app já e aproveite!"""
|
|
|
|
|
|
prompt = template.format(feature_description_prompt)
|
|
|
|
|
|
inputs = tokenizer.encode(prompt, return_tensors='pt').to(device)
|
|
|
|
|
|
prompt_length = inputs.shape[1]
|
|
|
|
|
|
outputs = model.generate(
|
|
inputs,
|
|
max_new_tokens=max_new_tokens,
|
|
num_return_sequences=num_return_sequences,
|
|
no_repeat_ngram_size=2,
|
|
do_sample=True,
|
|
top_k=50,
|
|
top_p=0.95,
|
|
temperature=0.7,
|
|
eos_token_id=tokenizer.eos_token_id,
|
|
pad_token_id=tokenizer.eos_token_id,
|
|
)
|
|
|
|
|
|
notas = []
|
|
for i in range(num_return_sequences):
|
|
|
|
output = outputs[i]
|
|
texto_completo = tokenizer.decode(output, skip_special_tokens=True)
|
|
|
|
|
|
texto_gerado = texto_completo[len(prompt):].strip()
|
|
|
|
|
|
nota_release = template.format(feature_description_prompt + ' ' + texto_gerado)
|
|
notas.append(nota_release)
|
|
return notas[0]
|
|
|
|
|
|
def chat_model(feature_description):
|
|
return gerar_nota_release(feature_description)
|
|
|
|
|
|
chat_interface = gr.Interface(
|
|
fn=chat_model,
|
|
inputs=gr.Textbox(lines=2, placeholder="Digite a descrição da funcionalidade..."),
|
|
outputs=gr.Textbox(),
|
|
title="Chat para Geração de Notas de Release",
|
|
description="Digite uma descrição de funcionalidade e o modelo gerará uma nota de release de acordo com o modelo treinado.",
|
|
)
|
|
|
|
|
|
if __name__ == "__main__":
|
|
chat_interface.launch(share=True)
|
|
|