drelhaj commited on
Commit
fa27525
·
verified ·
1 Parent(s): 80132d7

Upload app.py

Browse files
Files changed (1) hide show
  1. app.py +10 -7
app.py CHANGED
@@ -4,17 +4,20 @@ from transformers import AutoTokenizer, AutoModelForSeq2SeqLM
4
  model = AutoModelForSeq2SeqLM.from_pretrained("drelhaj/FinAraT5")
5
  tokenizer = AutoTokenizer.from_pretrained("drelhaj/FinAraT5")
6
 
7
- def summarize(text):
 
 
 
8
  inputs = tokenizer(text, return_tensors="pt", truncation=True)
9
  outputs = model.generate(**inputs, max_length=64)
10
  return tokenizer.decode(outputs[0], skip_special_tokens=True)
11
 
12
  demo = gr.Interface(
13
- fn=summarize,
14
- inputs=gr.Textbox(lines=5, placeholder="أدخل النص المالي هنا مع بادئة مثل 'لخص:'", label="النص المالي"),
15
- outputs=gr.Textbox(label="الملخص"),
16
- title="FinAraT5: ملخصات نصوص مالية باللغة العربية",
17
- description="أدخل نصًا ماليًا باللغة العربية مبدوءًا بـ 'لخص:' للحصول على ملخص باستخدام نموذج FinAraT5."
18
  )
19
 
20
- demo.launch()
 
4
  model = AutoModelForSeq2SeqLM.from_pretrained("drelhaj/FinAraT5")
5
  tokenizer = AutoTokenizer.from_pretrained("drelhaj/FinAraT5")
6
 
7
+ def summarise(text):
8
+ if not text.strip().startswith("لخص:"):
9
+ text = "لخص: " + text.strip()
10
+
11
  inputs = tokenizer(text, return_tensors="pt", truncation=True)
12
  outputs = model.generate(**inputs, max_length=64)
13
  return tokenizer.decode(outputs[0], skip_special_tokens=True)
14
 
15
  demo = gr.Interface(
16
+ fn=summarise,
17
+ inputs=gr.Textbox(lines=4, placeholder="أدخل نصًا ماليًا باللغة العربية..."),
18
+ outputs="text",
19
+ title="FinAraT5 Arabic Financial Summarisation",
20
+ description="أدخل نصًا ماليًا باللغة العربية يبدأ بـ 'لخص:' لتوليد ملخص قصير باستخدام نموذج FinAraT5."
21
  )
22
 
23
+ demo.launch()