Spaces:
Running
Running
Adapted demo to gr.Blocks()
Browse files
app.py
CHANGED
@@ -8,6 +8,11 @@ LANGUAGES_LIST = list(LANGUAGES.keys())
|
|
8 |
HF_TOKEN = os.environ.get('HF_TOKEN')
|
9 |
|
10 |
def translate_wrapper(text, src_lang, tgt_lang, by_sentence=True, clean=True, num_beams=4):
|
|
|
|
|
|
|
|
|
|
|
11 |
|
12 |
src_lang = LANGUAGES.get(src_lang)
|
13 |
tgt_lang = LANGUAGES.get(tgt_lang)
|
@@ -17,28 +22,61 @@ def translate_wrapper(text, src_lang, tgt_lang, by_sentence=True, clean=True, nu
|
|
17 |
|
18 |
|
19 |
hf_writer = gr.HuggingFaceDatasetSaver(HF_TOKEN, "AriNubar/hyw-en-crowd-source")
|
20 |
-
|
21 |
-
|
22 |
-
|
23 |
-
|
24 |
-
|
25 |
-
gr.Textbox(lines=5, label="Ներմուծման Գրութիւն | Input Text"),
|
26 |
-
gr.Dropdown(LANGUAGES_LIST, type="value", label="Թարգմանէ Այս Լեզուէ | Source Language"),
|
27 |
-
gr.Dropdown(LANGUAGES_LIST, type="value", label="Թարգմանէ Այս Լեզուի | Target Language"),
|
28 |
-
gr.Checkbox(label="Նախադասութիւններու Բաժնէ | Split into Sentences", value=True, info="Տուփը նշանագրեցէք եթէ կ'ուզէք ձեր գրութիւնը թարգմանուի նախադասութիւն առ նախադասութիւն։ Այս կերպով թարգմանուած նախադասութիւններուն որակը աւելի լաւ են։ | Check this box if you want to split your input text into sentences. This way the quality of the translation will be better."),
|
29 |
-
gr.Checkbox(label="Մշակէ | Preprocess", value=True, info="Տուփը նշանագրեցէք եթէ կ'ուզէք ձեր գրութիւնը կանոնաւորուի ծրագրի կողմէ թարգմանութենէ առաջ։ Կանոնաւորումը թարգմանութեան որակի բարելաւման համար օգտակար է։ | Check this box if you want to preprocess your input text before translation. This way the quality of the translation will be better."),
|
30 |
-
gr.Dropdown([1, 2, 3, 4, 5], type="value", label="Առնջութեան Շողեր | Number of Beams", value=4, info="Բարձր թիւը ընդհանրապէս կը պատճառէ աւելի բարձր որակի, բայց նոյնիսկ երկարատեւ թարգմանութեան։ | Higher beam size will result in better quality translation, but also longer translation time."),
|
31 |
-
],
|
32 |
-
"text",
|
33 |
-
title="Արեւմտահայերէն-Անգլերէն Մեքենական Թարգմանիչ | Western Armenian-English Machine Translation",
|
34 |
-
article= desc,
|
35 |
-
allow_flagging="manual",
|
36 |
-
flagging_callback=hf_writer,
|
37 |
-
flagging_options=["Լաւ թարգմանութիւն | Good Translation", "Միջակ թարգմանութիւն | Average Translation", "Վատ թարգմանութիւն | Bad Translation"]
|
38 |
)
|
39 |
|
40 |
-
|
41 |
-
|
42 |
-
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
43 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
44 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
8 |
HF_TOKEN = os.environ.get('HF_TOKEN')
|
9 |
|
10 |
def translate_wrapper(text, src_lang, tgt_lang, by_sentence=True, clean=True, num_beams=4):
|
11 |
+
if src_lang in ["", None, []] or tgt_lang in ["", None, []]:
|
12 |
+
return "Ընտրեցէք թարգմանութեան կողմերը | Please select source and target languages"
|
13 |
+
|
14 |
+
if src_lang == tgt_lang:
|
15 |
+
return "Ընտրուած լեզուները նոյնն են։ | Source and target languages are identical."
|
16 |
|
17 |
src_lang = LANGUAGES.get(src_lang)
|
18 |
tgt_lang = LANGUAGES.get(tgt_lang)
|
|
|
22 |
|
23 |
|
24 |
hf_writer = gr.HuggingFaceDatasetSaver(HF_TOKEN, "AriNubar/hyw-en-crowd-source")
|
25 |
+
|
26 |
+
|
27 |
+
theme = gr.themes.Default().set(
|
28 |
+
block_info_text_size="*text_xxs" # for info text
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
29 |
)
|
30 |
|
31 |
+
with gr.Blocks(title="Արեւմտահայերէն-Անգլերէն Մեքենական Թարգմանիչ | Western Armenian-English Machine Translation",
|
32 |
+
theme=theme,
|
33 |
+
) as demo:
|
34 |
+
gr.Markdown(
|
35 |
+
"""
|
36 |
+
# Արեւմտահայերէն-Անգլերէն Մեքենական Թարգմանիչ | Western Armenian-English Machine Translation
|
37 |
+
|
38 |
+
Հոս կը ցուցադրուի առաջին արեւմտահայերէն-անգլերէն մեքենական թարգմանիչը, որ կարուցուած է Մեթայի (Ֆեյսպուքի) 'No Language Left Behind' տիպարի հիման վրայ։ Թարգմանութեան տիպարը կ'աշխատի CPU-ի մը մէջ, ուրեմն նախադասութեան մը թարգմանութիւնը կրնայ տեւել մօտաւորապէս 40-60 երկվայրկեան։ Ձեր գնահատութիւնները եւ քննադատութիւնները շատ կարեւոր են տիպարի թարգմանութեան որակը բարելաւելու համար։ Շնորհակալութիւն Գալուստ Կիւլպէնկեան Հիմնադրամին, որուն աջակցութեամբ այս նախագիծը իրականացուեցաւ։
|
39 |
+
|
40 |
+
This is the demo of the first Western Armenian-English neural machine translation system which is based on Meta's 'No Language Left Behind' model. The model runs on a CPU, so it might take approximately 40-60 seconds to translate a single sentence. Your feedback and comments are very important for us to improve the quality of the translation. Thanks to the Calouste Gulbenkian Foundation for making this project possible with their support.
|
41 |
+
"""
|
42 |
+
)
|
43 |
|
44 |
+
with gr.Row():
|
45 |
+
with gr.Column():
|
46 |
+
text = gr.Textbox(lines=5, label="Ներմուծման Գրութիւն | Input Text")
|
47 |
+
with gr.Row():
|
48 |
+
src_lang = gr.Dropdown(LANGUAGES_LIST, type="value", label="Թարգմանէ Այս Լեզուէ | Source Language")
|
49 |
+
tgt_lang = gr.Dropdown(LANGUAGES_LIST, type="value", label="Թարգմանէ Այս Լեզուի | Target Language")
|
50 |
+
with gr.Column():
|
51 |
+
translated = gr.Textbox(lines=5, label="Ելքային Գրութիւն | Output Text", interactive=False)
|
52 |
+
translate_btn = gr.Button(value="Թարգմանէ | Translate", variant="primary")
|
53 |
+
with gr.Row():
|
54 |
+
with gr.Column():
|
55 |
+
gr.Markdown("""
|
56 |
+
### Թարգմանութեան Որակ | Translation Quality
|
57 |
+
""")
|
58 |
+
flag_good_btn = gr.Button(value="😊 Լաւ | Good", size="sm")
|
59 |
+
flag_average_btn = gr.Button(value="😐 Միջակ | Average", size="sm")
|
60 |
+
flag_bad_btn = gr.Button(value="☹️ Վատ | Bad", size="sm")
|
61 |
+
with gr.Row():
|
62 |
+
gr.Markdown("""
|
63 |
+
## Յարաչափեր | Parameters
|
64 |
+
"""
|
65 |
+
)
|
66 |
+
by_sentence = gr.Checkbox(label="Նախադասութիւններու Բաժնէ | Split into Sentences", value=True, info="Տուփը նշանագրեցէք եթէ կ'ուզէք ձեր գրութիւնը թարգմանուի նախադասութիւն առ նախադասութիւն։ Այս կերպով թարգմանուած նախադասութիւններուն որակը աւելի լաւ են։ | Check this box if you want to split your input text into sentences. This way the quality of the translation will be better.")
|
67 |
+
clean = gr.Checkbox(label="Մշակէ | Preprocess", value=True, info="Տուփը նշանագրեցէք եթէ կ'ուզէք ձեր գրութիւնը կանոնաւորուի ծրագրի կողմէ թարգմանութենէ առաջ։ Կանոնաւորումը թարգմանութեան որակի բարելաւման համար օգտակար է։ | Check this box if you want to preprocess your input text before translation. This way the quality of the translation will be better.")
|
68 |
+
num_beams = gr.Dropdown([1, 2, 3, 4, 5], type="value", label="Առնջութեան Շողեր | Number of Beams", value=4, info="Աւելի բարձր թիւը ընդհանրապէս կը պատճառէ աւելի բարձր որակի, բայց նոյնիսկ երկարատեւ թարգմանութեան։ | Higher beam size will result in better quality translation, but also longer translation time.")
|
69 |
+
|
70 |
+
translate_btn.click(translate_wrapper, inputs=[text, src_lang, tgt_lang, by_sentence, clean, num_beams], outputs=translated)
|
71 |
+
|
72 |
+
hf_writer.setup([src_lang, tgt_lang, text, translated, by_sentence, clean, num_beams, flag_bad_btn], "flagged_data_points")
|
73 |
|
74 |
+
flag_good_btn.click(lambda *args: hf_writer.flag(args), [src_lang, tgt_lang, text, translated, by_sentence, clean, num_beams, flag_good_btn], None, preprocess=False)
|
75 |
+
flag_average_btn.click(lambda *args: hf_writer.flag(args), [src_lang, tgt_lang, text, translated, by_sentence, clean, num_beams, flag_average_btn], None, preprocess=False)
|
76 |
+
flag_bad_btn.click(lambda *args: hf_writer.flag(args), [src_lang, tgt_lang, text, translated, by_sentence, clean, num_beams, flag_bad_btn], None, preprocess=False)
|
77 |
+
|
78 |
+
|
79 |
+
|
80 |
+
if __name__ == "__main__":
|
81 |
+
translator = Translator()
|
82 |
+
demo.launch()
|