Norod78's picture
Update app.py
726fe6a
raw
history blame
2.92 kB
import gradio as gr
import torch
from transformers import pipeline, set_seed, AutoTokenizer, AutoModelForCausalLM
import random
title = "מחולל תקצירים פיקטיביים לספרים - מבוסס ג׳פיטי-נאו פצפון"
article = "מודל השפה אומן על ידי <a href=\"https://linktr.ee/Norod78\">דורון אדלר</a>"
description = "<p>Fine tuned <a href=\"https://huggingface.co/Norod78/hebrew-gpt_neo-tiny\">Norod78/hebrew-gpt_neo-tiny</a> upon a book summary dataset<p>"
examples = [
['הארי פוטר'],
['החתול המכאני'],
['אם מתחשק לכם לפעמים'],
["מחוללי הטקסט / "],
['האדם האחרון עלי אדמות ישב לבד בחדרו כשלפתע נשמע דפיקה'],
]
model_id = "./hebrew-gpt_neo-tiny-HebrewBookSummaries"
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
n_gpu = 0 if torch.cuda.is_available()==False else torch.cuda.device_count()
tokenizer = AutoTokenizer.from_pretrained(model_id, bos_token='<|startoftext|>', eos_token='<|endoftext|>', pad_token='<|pad|>', unknown_token = '<|unknown|>')
model = AutoModelForCausalLM.from_pretrained(model_id).to(device)
model.resize_token_embeddings(len(tokenizer))
text_generator = pipeline('text-generation', model=model, tokenizer=tokenizer)
max_length = 96
top_k = 40
top_p = 0.92
temperature = 0.8
max_seed = (2**32)-1
global_seed = random.randint(0, max_seed)
def text_generation(input_text = ''):
global global_seed
global_seed = global_seed + 1
if global_seed >= max_seed:
global_seed = 0
if input_text == None or len(input_text) == 0:
input_text = "<|startoftext|>"
set_seed(global_seed)
generated_text = text_generator(input_text,
max_length=max_length,
top_k=top_k,
top_p=top_p,
temperature=temperature,
do_sample=True,
repetition_penalty=2.0,
num_return_sequences=1)
parsed_text = generated_text[0]["generated_text"].replace("<|startoftext|>", "").replace("\r","\n").replace("\n\n", "\n").replace("\t", " ").replace("<|pad|>", " * ").replace("\"\"", "\"").strip()
print("parsed_text = \"" + parsed_text + "\" (seed = " + str(global_seed) + ")")
return parsed_text
gr.Interface(
text_generation,
inputs=gr.Textbox(lines=1, label=".הזינו פה את מילות הפתיחה של הטקסט, בחרו את אחת מן הדוגמאות המוכנות או השאירו ריק. מה שבא לכם. בכל לחיצה על סאבמיט, יווצר טקסט אחר", elem_id="input_text"),
outputs=gr.Textbox(type="text", label="פה מופיע הטקסט שהמחולל יוצר", elem_id="output_text"),
css="#output_text{direction: rtl} #input_text{direction: rtl}",
title=title,
description=description,
article=article,
examples=examples,
cache_examples=False,
allow_flagging='never',
).launch()