Spaces:

Norod78
/

HebrewBookSummaries

Paused

App Files Files Community

HebrewBookSummaries / app.py

Norod78

Update app.py

726fe6a almost 2 years ago

raw

history blame

2.92 kB

	import gradio as gr
	import torch
	from transformers import pipeline, set_seed, AutoTokenizer, AutoModelForCausalLM
	import random

	title = "מחולל תקצירים פיקטיביים לספרים - מבוסס ג׳פיטי-נאו פצפון"
	article = "מודל השפה אומן על ידי <a href=\"https://linktr.ee/Norod78\">דורון אדלר</a>"
	description = "<p>Fine tuned <a href=\"https://huggingface.co/Norod78/hebrew-gpt_neo-tiny\">Norod78/hebrew-gpt_neo-tiny</a> upon a book summary dataset<p>"

	examples = [
	['הארי פוטר'],
	['החתול המכאני'],
	['אם מתחשק לכם לפעמים'],
	["מחוללי הטקסט / "],
	['האדם האחרון עלי אדמות ישב לבד בחדרו כשלפתע נשמע דפיקה'],
	]

	model_id = "./hebrew-gpt_neo-tiny-HebrewBookSummaries"

	device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
	n_gpu = 0 if torch.cuda.is_available()==False else torch.cuda.device_count()
	tokenizer = AutoTokenizer.from_pretrained(model_id, bos_token='<\|startoftext\|>', eos_token='<\|endoftext\|>', pad_token='<\|pad\|>', unknown_token = '<\|unknown\|>')
	model = AutoModelForCausalLM.from_pretrained(model_id).to(device)
	model.resize_token_embeddings(len(tokenizer))
	text_generator = pipeline('text-generation', model=model, tokenizer=tokenizer)

	max_length = 96
	top_k = 40
	top_p = 0.92
	temperature = 0.8
	max_seed = (2**32)-1
	global_seed = random.randint(0, max_seed)

	def text_generation(input_text = ''):
	global global_seed
	global_seed = global_seed + 1
	if global_seed >= max_seed:
	global_seed = 0
	if input_text == None or len(input_text) == 0:
	input_text = "<\|startoftext\|>"
	set_seed(global_seed)
	generated_text = text_generator(input_text,
	max_length=max_length,
	top_k=top_k,
	top_p=top_p,
	temperature=temperature,
	do_sample=True,
	repetition_penalty=2.0,
	num_return_sequences=1)
	parsed_text = generated_text[0]["generated_text"].replace("<\|startoftext\|>", "").replace("\r","\n").replace("\n\n", "\n").replace("\t", " ").replace("<\|pad\|>", " * ").replace("\"\"", "\"").strip()
	print("parsed_text = \"" + parsed_text + "\" (seed = " + str(global_seed) + ")")
	return parsed_text
	gr.Interface(
	text_generation,
	inputs=gr.Textbox(lines=1, label=".הזינו פה את מילות הפתיחה של הטקסט, בחרו את אחת מן הדוגמאות המוכנות או השאירו ריק. מה שבא לכם. בכל לחיצה על סאבמיט, יווצר טקסט אחר", elem_id="input_text"),
	outputs=gr.Textbox(type="text", label="פה מופיע הטקסט שהמחולל יוצר", elem_id="output_text"),
	css="#output_text{direction: rtl} #input_text{direction: rtl}",
	title=title,
	description=description,
	article=article,
	examples=examples,
	cache_examples=False,
	allow_flagging='never',
	).launch()