Instruction and answer must be in the same language?

#1
by rub2000 - opened

Hi Does the instruction and the answer must be in he same language? From the example the instruction is in Malay.
Can i have instruction in English but answer in Malay?
For example:
Generate a story about a bunny in Malay?

AI Singapore org

Hi @rub2000 ,

Thank you for your interest in SEA-LION!

Yes, you can have the instruction in English and prompt it to answer in another supported language.

For example:
Instruction:
Generate a story about a bunny in Malay

SEA-LION:

Dahulu kala di sebuah padang hijau yang indah, hiduplah seekor kelinci bernama Kiko. Kiko mempunyai bulu putih yang lembut dan mata coklat yang berbinar. Ia sangat suka bermain di padang itu, melompat dari satu bunga ke bunga lainnya dan mencari kupu-kupu yang cantik.
Kiko adalah kelinci yang sangat baik hati. Setiap hari, ia akan membantu neneknya yang tinggal di sebuah lubang di dekat padang dengan mengumpulkan sayur-sayuran dan buah-buahan yang tumbuh di sekitar. Nenek Kiko sangat bangga dengan cucu lelaki yang baik hatinya.
Suatu hari, hujan turun dengan lebat dan menghanyutkan beberapa bunga cantik di padang. Kiko merasa sedih melihat bunga-bunga itu hilang. Ia memutuskan untuk berbuat sesuatu untuk membantu bunga-bunga itu kembali. Kiko mengumpulkan semua biji bunga dan menanamnya di tempat yang lebih aman.
Setiap hari, Kiko akan melihat dan merawat tanaman-tanaman itu dengan sabar. Ia minum air hujan dan memberikan sedikit makanan kepada tanaman-tanaman itu agar tumbuh dengan baik. Akhirnya, bunga-bunga itu mulai tumbuh kembali dengan indahnya.
Semua binatang di padang itu sangat gembira melihat bunga-bunga itu kembali. Mereka semua berterima kasih kepada Kiko atas kebaikan hatinya. Kiko merasa bahagia karena telah membantu dan membuat padang itu kembali indah.
Dari hari itu, Kiko dikenal sebagai kelinci paling baik hati di padang itu. Ia terus membantu dan menjaga alam sekitarnya, membuktikan bahwa kebaikan hati sejati dapat membuat dunia menjadi lebih indah.

Another example using Malay instruction to generate answer in Chinese:
Instruction:
Tulis cerita tentang arnab dalam bahasa Cina

SEA-LION:

有一只叫小白的兔子,它住在一个美丽的草地上。小白兔很聪明,喜欢探索和玩耍。有一天,小白兔发现了一片大草地,满是新鲜的草和花朵,它感到非常兴奋。
小白兔开始跳跃,享受着大草地的美好。它遇到了一只友好的蝴蝶,蝴蝶问它:“小白兔,为什么你看起来这么快乐?”小白兔回答:“因为我发现了这么美丽的地方,我想享受每一分每一秒!”
蝴蝶听了,很感动,它说:“你的心态真好,希望你能永远保持这样的幸福感。”小白兔感谢蝴蝶,继续享受大草地的美好。
从那天起,小白兔每天都来到这个大草地,享受生活的美好,和各种动物友好相处。它教会了所有人,快乐来自于心态和对生活的热爱。

Hope this helps.

Thanks Raymond. How about informal language? Was it fine tuned using informal language as well?

AI Singapore org

Hi @rub2000 ,

SEA-LION is trained on fair use open source web crawled data which definitely include at least some form of informal and colloquial data.
However, since most informal languages are used in comment sections and forums etc, which tends to be blocked from web crawlers, the amount of informal and colloquial data present the in the training dataset are quite limited. This is especially so for lower resource languages like Burmese, Khmer, Lao, etc.

Therefore, it is highly recommend to have a test set of your intended use case and benchmark against SEA-LION to determine if SEA-LION informal languages capabilities are suitable for your use case.

Hope this helps.

Sign up or log in to comment