Spaces:
Running
on
CPU Upgrade
Running
on
CPU Upgrade
File size: 43,778 Bytes
9d298eb b2ecf7d |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223 224 225 226 227 228 229 230 231 232 233 234 235 236 237 238 239 240 241 242 243 244 245 246 247 248 249 250 251 252 253 254 255 256 257 258 259 260 261 262 263 264 265 266 267 268 269 270 271 272 273 274 275 276 277 278 279 280 281 282 283 284 285 286 287 288 289 290 291 292 293 294 295 296 297 298 299 300 301 302 303 304 305 306 307 308 309 310 311 312 313 314 315 316 317 318 319 320 321 322 323 324 325 326 327 328 329 330 331 332 333 334 335 336 337 338 339 340 341 342 343 344 345 346 347 348 349 350 351 352 353 354 355 356 357 358 359 360 361 362 363 364 365 366 367 368 369 370 371 372 373 374 375 376 377 378 379 380 381 382 383 384 385 386 387 388 389 390 391 392 393 394 395 396 397 398 399 400 401 402 403 404 405 406 407 408 409 410 411 412 413 414 415 416 417 418 419 420 421 422 423 424 425 426 427 428 429 430 431 432 433 434 435 436 437 438 439 440 441 442 443 444 445 446 447 448 449 450 451 452 453 454 455 456 457 458 459 460 461 462 463 464 465 466 467 468 469 470 471 472 473 474 475 476 477 478 479 480 481 482 483 484 485 486 487 488 489 490 491 492 493 494 495 496 497 498 499 500 501 502 503 504 505 506 507 508 509 510 511 512 513 514 515 516 517 518 519 520 521 522 523 524 525 526 527 528 529 530 531 532 533 534 535 536 537 538 539 540 541 542 543 544 545 546 547 548 549 550 551 552 553 554 555 556 557 558 559 560 561 562 563 564 565 566 567 568 569 570 571 572 573 574 575 576 577 578 579 580 581 582 583 584 585 586 587 588 589 590 591 592 593 594 595 596 597 598 599 600 601 602 603 604 605 606 607 608 609 610 611 612 613 614 615 616 617 618 619 620 621 622 623 624 625 626 627 628 629 630 631 632 633 634 635 636 637 638 639 640 641 642 643 644 645 646 647 648 649 650 651 652 653 654 655 656 657 658 659 660 661 662 663 664 665 666 667 668 669 670 671 672 673 674 675 676 677 678 679 680 681 682 683 684 685 686 687 688 689 690 691 692 693 694 695 696 697 698 699 700 701 702 703 704 705 706 707 708 709 710 711 712 713 714 715 716 717 718 719 |
import type { WidgetExample } from "./model-data";
import type { PipelineType } from "./pipelines";
type LanguageCode = string;
type PerLanguageMapping = Map<PipelineType, string[] | WidgetExample[]>;
/// NOTE TO CONTRIBUTORS:
///
/// When adding sample inputs for a new language, you don't
/// necessarily have to translate the inputs from existing languages.
/// (which were quite random to begin with)
///
/// i.e. Feel free to be creative and provide better samples.
//
/// The <mask> placeholder will be replaced by the correct mask token
/// in the following examples, depending on the model type
///
/// see [INTERNAL] github.com/huggingface/moon-landing/blob/c5c3d45fe0ab27347b3ab27bdad646ef20732351/server/lib/App.ts#L254
//
const MAPPING_EN: PerLanguageMapping = new Map([
["text-classification", [`I like you. I love you`]],
[
"token-classification",
[
`My name is Wolfgang and I live in Berlin`,
`My name is Sarah and I live in London`,
`My name is Clara and I live in Berkeley, California.`,
],
],
[
"table-question-answering",
[
{
text: `How many stars does the transformers repository have?`,
table: {
Repository: ["Transformers", "Datasets", "Tokenizers"],
Stars: [36542, 4512, 3934],
Contributors: [651, 77, 34],
"Programming language": ["Python", "Python", "Rust, Python and NodeJS"],
},
},
],
],
[
"question-answering",
[
{
text: `Where do I live?`,
context: `My name is Wolfgang and I live in Berlin`,
},
{
text: `Where do I live?`,
context: `My name is Sarah and I live in London`,
},
{
text: `What's my name?`,
context: `My name is Clara and I live in Berkeley.`,
},
{
text: `Which name is also used to describe the Amazon rainforest in English?`,
context: `The Amazon rainforest (Portuguese: Floresta Amazônica or Amazônia; Spanish: Selva Amazónica, Amazonía or usually Amazonia; French: Forêt amazonienne; Dutch: Amazoneregenwoud), also known in English as Amazonia or the Amazon Jungle, is a moist broadleaf forest that covers most of the Amazon basin of South America. This basin encompasses 7,000,000 square kilometres (2,700,000 sq mi), of which 5,500,000 square kilometres (2,100,000 sq mi) are covered by the rainforest. This region includes territory belonging to nine nations. The majority of the forest is contained within Brazil, with 60% of the rainforest, followed by Peru with 13%, Colombia with 10%, and with minor amounts in Venezuela, Ecuador, Bolivia, Guyana, Suriname and French Guiana. States or departments in four nations contain "Amazonas" in their names. The Amazon represents over half of the planet's remaining rainforests, and comprises the largest and most biodiverse tract of tropical rainforest in the world, with an estimated 390 billion individual trees divided into 16,000 species.`,
},
],
],
[
"zero-shot-classification",
[
{
text: "I have a problem with my iphone that needs to be resolved asap!!",
candidate_labels: "urgent, not urgent, phone, tablet, computer",
multi_class: true,
},
{
text: "Last week I upgraded my iOS version and ever since then my phone has been overheating whenever I use your app.",
candidate_labels: "mobile, website, billing, account access",
multi_class: false,
},
{
text: "A new model offers an explanation for how the Galilean satellites formed around the solar system’s largest world. Konstantin Batygin did not set out to solve one of the solar system’s most puzzling mysteries when he went for a run up a hill in Nice, France. Dr. Batygin, a Caltech researcher, best known for his contributions to the search for the solar system’s missing “Planet Nine,” spotted a beer bottle. At a steep, 20 degree grade, he wondered why it wasn’t rolling down the hill. He realized there was a breeze at his back holding the bottle in place. Then he had a thought that would only pop into the mind of a theoretical astrophysicist: “Oh! This is how Europa formed.” Europa is one of Jupiter’s four large Galilean moons. And in a paper published Monday in the Astrophysical Journal, Dr. Batygin and a co-author, Alessandro Morbidelli, a planetary scientist at the Côte d’Azur Observatory in France, present a theory explaining how some moons form around gas giants like Jupiter and Saturn, suggesting that millimeter-sized grains of hail produced during the solar system’s formation became trapped around these massive worlds, taking shape one at a time into the potentially habitable moons we know today.",
candidate_labels: "space & cosmos, scientific discovery, microbiology, robots, archeology",
multi_class: true,
},
],
],
["translation", [`My name is Wolfgang and I live in Berlin`, `My name is Sarah and I live in London`]],
[
"summarization",
[
`The tower is 324 metres (1,063 ft) tall, about the same height as an 81-storey building, and the tallest structure in Paris. Its base is square, measuring 125 metres (410 ft) on each side. During its construction, the Eiffel Tower surpassed the Washington Monument to become the tallest man-made structure in the world, a title it held for 41 years until the Chrysler Building in New York City was finished in 1930. It was the first structure to reach a height of 300 metres. Due to the addition of a broadcasting aerial at the top of the tower in 1957, it is now taller than the Chrysler Building by 5.2 metres (17 ft). Excluding transmitters, the Eiffel Tower is the second tallest free-standing structure in France after the Millau Viaduct.`,
],
],
[
"conversational",
[
`Hey my name is Julien! How are you?`,
`Hey my name is Thomas! How are you?`,
`Hey my name is Mariama! How are you?`,
`Hey my name is Clara! How are you?`,
`Hey my name is Julien! How are you?`,
`Hi.`,
],
],
[
"text-generation",
[
`My name is Julien and I like to`,
`My name is Thomas and my main`,
`My name is Mariama, my favorite`,
`My name is Clara and I am`,
`My name is Lewis and I like to`,
`My name is Merve and my favorite`,
`My name is Teven and I am`,
`Once upon a time,`,
],
],
["fill-mask", [`Paris is the <mask> of France.`, `The goal of life is <mask>.`]],
[
"sentence-similarity",
[
{
source_sentence: "That is a happy person",
sentences: ["That is a happy dog", "That is a very happy person", "Today is a sunny day"],
},
],
],
]);
const MAPPING_ZH: PerLanguageMapping = new Map([
["text-classification", [`我喜欢你。 我爱你`]],
["token-classification", [`我叫沃尔夫冈,我住在柏林。`, `我叫萨拉,我住在伦敦。`, `我叫克拉拉,我住在加州伯克利。`]],
[
"question-answering",
[
{
text: `我住在哪里?`,
context: `我叫沃尔夫冈,我住在柏林。`,
},
{
text: `我住在哪里?`,
context: `我叫萨拉,我住在伦敦。`,
},
{
text: `我的名字是什么?`,
context: `我叫克拉拉,我住在伯克利。`,
},
],
],
["translation", [`我叫沃尔夫冈,我住在柏林。`, `我叫萨拉,我住在伦敦。`]],
[
"zero-shot-classification",
[
{
text: "房间干净明亮,非常不错",
candidate_labels: "这是一条差评, 这是一条好评",
},
],
],
[
"summarization",
[
`该塔高324米(1063英尺),与一幢81层的建筑物一样高,是巴黎最高的建筑物。 它的底座是方形的,每边长125米(410英尺)。 在建造过程中,艾菲尔铁塔超过了华盛顿纪念碑,成为世界上最高的人造结构,它保持了41年的头衔,直到1930年纽约市的克莱斯勒大楼竣工。这是第一个到达300米高度的结构。 由于1957年在塔顶增加了广播天线,因此它现在比克莱斯勒大厦高5.2米(17英尺)。 除发射器外,艾菲尔铁塔是法国第二高的独立式建筑,仅次于米劳高架桥。`,
],
],
[
"text-generation",
[`我叫朱利安,我喜欢`, `我叫托马斯,我的主要`, `我叫玛丽亚,我最喜欢的`, `我叫克拉拉,我是`, `从前,`],
],
["fill-mask", [`巴黎是<mask>国的首都。`, `生活的真谛是<mask>。`]],
[
"sentence-similarity",
[
{
source_sentence: "那是 個快樂的人",
sentences: ["那是 條快樂的狗", "那是 個非常幸福的人", "今天是晴天"],
},
],
],
]);
const MAPPING_FR: PerLanguageMapping = new Map([
["text-classification", [`Je t'apprécie beaucoup. Je t'aime.`]],
["token-classification", [`Mon nom est Wolfgang et je vis à Berlin`]],
[
"question-answering",
[
{
text: `Où est-ce que je vis?`,
context: `Mon nom est Wolfgang et je vis à Berlin`,
},
],
],
["translation", [`Mon nom est Wolfgang et je vis à Berlin`]],
[
"summarization",
[
`La tour fait 324 mètres (1,063 pieds) de haut, environ la même hauteur qu'un immeuble de 81 étages, et est la plus haute structure de Paris. Sa base est carrée, mesurant 125 mètres (410 pieds) sur chaque côté. Durant sa construction, la tour Eiffel surpassa le Washington Monument pour devenir la plus haute structure construite par l'homme dans le monde, un titre qu'elle conserva pendant 41 ans jusqu'à l'achèvement du Chrysler Building à New-York City en 1930. Ce fut la première structure à atteindre une hauteur de 300 mètres. Avec l'ajout d'une antenne de radiodiffusion au sommet de la tour Eiffel en 1957, celle-ci redevint plus haute que le Chrysler Building de 5,2 mètres (17 pieds). En excluant les transmetteurs, elle est la seconde plus haute stucture autoportante de France après le viaduc de Millau.`,
],
],
["text-generation", [`Mon nom est Julien et j'aime`, `Mon nom est Thomas et mon principal`, `Il était une fois`]],
["fill-mask", [`Paris est la <mask> de la France.`]],
[
"sentence-similarity",
[
{
source_sentence: "C'est une personne heureuse",
sentences: [
"C'est un chien heureux",
"C'est une personne très heureuse",
"Aujourd'hui est une journée ensoleillée",
],
},
],
],
]);
const MAPPING_ES: PerLanguageMapping = new Map([
["text-classification", [`Te quiero. Te amo.`]],
["token-classification", [`Me llamo Wolfgang y vivo en Berlin`]],
[
"question-answering",
[
{
text: `¿Dónde vivo?`,
context: `Me llamo Wolfgang y vivo en Berlin`,
},
{
text: `¿Quién inventó el submarino?`,
context: `Isaac Peral fue un murciano que inventó el submarino`,
},
{
text: `¿Cuántas personas hablan español?`,
context: `El español es el segundo idioma más hablado del mundo con más de 442 millones de hablantes`,
},
],
],
[
"translation",
[
`Me llamo Wolfgang y vivo en Berlin`,
`Los ingredientes de una tortilla de patatas son: huevos, patatas y cebolla`,
],
],
[
"summarization",
[
`La torre tiene 324 metros (1.063 pies) de altura, aproximadamente la misma altura que un edificio de 81 pisos y la estructura más alta de París. Su base es cuadrada, mide 125 metros (410 pies) a cada lado. Durante su construcción, la Torre Eiffel superó al Washington Monument para convertirse en la estructura artificial más alta del mundo, un título que mantuvo durante 41 años hasta que el Chrysler Building en la ciudad de Nueva York se terminó en 1930. Fue la primera estructura en llegar Una altura de 300 metros. Debido a la adición de una antena de transmisión en la parte superior de la torre en 1957, ahora es más alta que el Chrysler Building en 5,2 metros (17 pies). Excluyendo los transmisores, la Torre Eiffel es la segunda estructura independiente más alta de Francia después del Viaducto de Millau.`,
],
],
[
"text-generation",
[
`Me llamo Julien y me gusta`,
`Me llamo Thomas y mi principal`,
`Me llamo Manuel y trabajo en`,
`Érase una vez,`,
`Si tú me dices ven, `,
],
],
["fill-mask", [`Mi nombre es <mask> y vivo en Nueva York.`, `El español es un idioma muy <mask> en el mundo.`]],
[
"sentence-similarity",
[
{
source_sentence: "Esa es una persona feliz",
sentences: ["Ese es un perro feliz", "Esa es una persona muy feliz", "Hoy es un día soleado"],
},
],
],
]);
const MAPPING_RU: PerLanguageMapping = new Map([
["text-classification", [`Ты мне нравишься. Я тебя люблю`]],
["token-classification", [`Меня зовут Вольфганг и я живу в Берлине`]],
[
"question-answering",
[
{
text: `Где живу?`,
context: `Меня зовут Вольфганг и я живу в Берлине`,
},
],
],
["translation", [`Меня зовут Вольфганг и я живу в Берлине`]],
[
"summarization",
[
`Высота башни составляет 324 метра (1063 фута), примерно такая же высота, как у 81-этажного здания, и самое высокое сооружение в Париже. Его основание квадратно, размером 125 метров (410 футов) с любой стороны. Во время строительства Эйфелева башня превзошла монумент Вашингтона, став самым высоким искусственным сооружением в мире, и этот титул она удерживала в течение 41 года до завершения строительство здания Крайслер в Нью-Йорке в 1930 году. Это первое сооружение которое достигло высоты 300 метров. Из-за добавления вещательной антенны на вершине башни в 1957 году она сейчас выше здания Крайслер на 5,2 метра (17 футов). За исключением передатчиков, Эйфелева башня является второй самой высокой отдельно стоящей структурой во Франции после виадука Мийо.`,
],
],
["text-generation", [`Меня зовут Жюльен и`, `Меня зовут Томас и мой основной`, `Однажды`]],
["fill-mask", [`Меня зовут <mask> и я инженер живущий в Нью-Йорке.`]],
[
"sentence-similarity",
[
{
source_sentence: "Это счастливый человек",
sentences: ["Это счастливая собака", "Это очень счастливый человек", "Сегодня солнечный день"],
},
],
],
]);
const MAPPING_UK: PerLanguageMapping = new Map([
["translation", [`Мене звати Вольфґанґ і я живу в Берліні.`]],
["fill-mask", [`Мене звати <mask>.`]],
]);
const MAPPING_IT: PerLanguageMapping = new Map([
["text-classification", [`Mi piaci. Ti amo`]],
[
"token-classification",
[
`Mi chiamo Wolfgang e vivo a Berlino`,
`Mi chiamo Sarah e vivo a Londra`,
`Mi chiamo Clara e vivo a Berkeley in California.`,
],
],
[
"question-answering",
[
{
text: `Dove vivo?`,
context: `Mi chiamo Wolfgang e vivo a Berlino`,
},
{
text: `Dove vivo?`,
context: `Mi chiamo Sarah e vivo a Londra`,
},
{
text: `Come mio chiamo?`,
context: `Mi chiamo Clara e vivo a Berkeley.`,
},
],
],
["translation", [`Mi chiamo Wolfgang e vivo a Berlino`, `Mi chiamo Sarah e vivo a Londra`]],
[
"summarization",
[
`La torre degli Asinelli è una delle cosiddette due torri di Bologna, simbolo della città, situate in piazza di porta Ravegnana, all'incrocio tra le antiche strade San Donato (ora via Zamboni), San Vitale, Maggiore e Castiglione. Eretta, secondo la tradizione, fra il 1109 e il 1119 dal nobile Gherardo Asinelli, la torre è alta 97,20 metri, pende verso ovest per 2,23 metri e presenta all'interno una scalinata composta da 498 gradini. Ancora non si può dire con certezza quando e da chi fu costruita la torre degli Asinelli. Si presume che la torre debba il proprio nome a Gherardo Asinelli, il nobile cavaliere di fazione ghibellina al quale se ne attribuisce la costruzione, iniziata secondo una consolidata tradizione l'11 ottobre 1109 e terminata dieci anni dopo, nel 1119.`,
],
],
[
"text-generation",
[
`Mi chiamo Loreto e mi piace`,
`Mi chiamo Thomas e il mio principale`,
`Mi chiamo Marianna, la mia cosa preferita`,
`Mi chiamo Clara e sono`,
`C'era una volta`,
],
],
["fill-mask", [`Roma è la <mask> d'Italia.`, `Lo scopo della vita è <mask>.`]],
[
"sentence-similarity",
[
{
source_sentence: "Questa è una persona felice",
sentences: ["Questo è un cane felice", "Questa è una persona molto felice", "Oggi è una giornata di sole"],
},
],
],
]);
const MAPPING_FA: PerLanguageMapping = new Map([
[
"text-classification",
[`پروژه به موقع تحویل شد و همه چیز خوب بود.`, `سیبزمینی بیکیفیت بود.`, `قیمت و کیفیت عالی`, `خوب نبود اصلا`],
],
[
"token-classification",
[
`این سریال به صورت رسمی در تاریخ دهم می ۲۰۱۱ توسط شبکه فاکس برای پخش رزرو شد.`,
`دفتر مرکزی شرکت پارسمینو در شهر اراک در استان مرکزی قرار دارد.`,
`وی در سال ۲۰۱۳ درگذشت و مسئول خاکسپاری و اقوامش برای او مراسم یادبود گرفتند.`,
],
],
[
"question-answering",
[
{
text: `من کجا زندگی میکنم؟`,
context: `نام من پژمان است و در گرگان زندگی میکنم.`,
},
{
text: `نامم چیست و کجا زندگی میکنم؟`,
context: `اسمم سارا است و در آفریقای جنوبی زندگی میکنم.`,
},
{
text: `نام من چیست؟`,
context: `من مریم هستم و در تبریز زندگی میکنم.`,
},
{
text: `بیشترین مساحت جنگل آمازون در کدام کشور است؟`,
context: [
"آمازون نام بزرگترین جنگل بارانی جهان است که در شمال آمریکای جنوبی قرار گرفته و بیشتر آن در خاک برزیل و پرو",
"جای دارد. بیش از نیمی از همه جنگلهای بارانی باقیمانده در جهان در آمازون قرار دارد.",
"مساحت جنگلهای آمازون ۵٫۵ میلیون کیلومتر مربع است که بین ۹ کشور تقسیم شدهاست.",
].join("\n"),
},
],
],
[
"translation",
[
"بیشتر مساحت جنگلهای آمازون در حوضه آبریز رود آمازون و ۱۱۰۰ شاخه آن واقع شدهاست.",
"مردمان نَبَطی از هزارههای یکم و دوم پیش از میلاد در این منطقه زندگی میکردند.",
],
],
[
"summarization",
[
[
"شاهنامه اثر حکیم ابوالقاسم فردوسی توسی، حماسهای منظوم، بر حسب دست نوشتههای ",
"موجود دربرگیرنده نزدیک به ۵۰٬۰۰۰ بیت تا نزدیک به ۶۱٬۰۰۰ بیت و یکی از ",
"بزرگترین و برجستهترین سرودههای حماسی جهان است که سرایش آن دستآوردِ ",
"دستکم سی سال کارِ پیوستهٔ این سخنسرای نامدار ایرانی است. موضوع این شاهکار ادبی،",
" افسانهها و تاریخ ایران از آغاز تا حملهٔ عربها به ایران در سدهٔ هفتم میلادی است",
" (شاهنامه از سه بخش اسطوره، پهلوانی و تاریخی تشکیل شدهاست) که در چهار",
" دودمان پادشاهیِ پیشدادیان، کیانیان، اشکانیان و ساسانیان گنجانده میشود.",
" شاهنامه بر وزن «فَعولُن فعولن فعولن فَعَلْ»، در بحرِ مُتَقارِبِ مثمَّنِ محذوف نگاشته شدهاست.",
"هنگامی که زبان دانش و ادبیات در ایران زبان عربی بود، فردوسی، با سرودن شاهنامه",
" با ویژگیهای هدفمندی که داشت، زبان پارسی را زنده و پایدار کرد. یکی از ",
" بنمایههای مهمی که فردوسی برای سرودن شاهنامه از آن استفاده کرد،",
" شاهنامهٔ ابومنصوری بود. شاهنامه نفوذ بسیاری در جهتگیری ",
" فرهنگ فارسی و نیز بازتابهای شکوهمندی در ادبیات جهان داشتهاست و شاعران ",
" بزرگی مانند گوته و ویکتور هوگو از آن به نیکی یاد کردهاند.",
].join("\n"),
],
],
["text-generation", ["اسم من نازنین است و من", "روزی روزگاری"]],
[
"fill-mask",
[
`زندگی یک سوال است و این که چگونه <mask> کنیم پاسخ این سوال!`,
`زندگی از مرگ پرسید: چرا همه من را <mask> دارند اما از تو متنفرند؟`,
],
],
]);
const MAPPING_AR: PerLanguageMapping = new Map([
["text-classification", [`أحبك. أهواك`]],
[
"token-classification",
[`إسمي محمد وأسكن في برلين`, `إسمي ساره وأسكن في لندن`, `إسمي سامي وأسكن في القدس في فلسطين.`],
],
[
"question-answering",
[
{
text: `أين أسكن؟`,
context: `إسمي محمد وأسكن في بيروت`,
},
{
text: `أين أسكن؟`,
context: `إسمي ساره وأسكن في لندن`,
},
{
text: `ما اسمي؟`,
context: `اسمي سعيد وأسكن في حيفا.`,
},
{
text: `ما لقب خالد بن الوليد بالعربية؟`,
context: `خالد بن الوليد من أبطال وقادة الفتح الإسلامي وقد تحدثت عنه اللغات الإنجليزية والفرنسية والإسبانية ولقب بسيف الله المسلول.`,
},
],
],
["translation", [`إسمي محمد وأسكن في برلين`, `إسمي ساره وأسكن في لندن`]],
[
"summarization",
[
`تقع الأهرامات في الجيزة قرب القاهرة في مصر وقد بنيت منذ عدة قرون، وقيل إنها كانت قبورا للفراعنة وتم بناؤها بعملية هندسية رائعة واستقدمت حجارتها من جبل المقطم وتم نقلها بالسفن أو على الرمل، وما تزال شامخة ويقصدها السياح من كافة أرجاء المعمورة.`,
],
],
[
"text-generation",
[
`إسمي محمد وأحب أن`,
`دع المكارم لا ترحل لبغيتها - واقعد فإنك أنت الطاعم الكاسي.`,
`لماذا نحن هنا؟`,
`القدس مدينة تاريخية، بناها الكنعانيون في`,
`كان يا ما كان في قديم الزمان`,
],
],
["fill-mask", [`باريس <mask> فرنسا.`, `فلسفة الحياة هي <mask>.`]],
[
"sentence-similarity",
[
{
source_sentence: "هذا شخص سعيد",
sentences: ["هذا كلب سعيد", "هذا شخص سعيد جدا", "اليوم هو يوم مشمس"],
},
],
],
]);
const MAPPING_BN: PerLanguageMapping = new Map([
["text-classification", [`বাঙালির ঘরে ঘরে আজ নবান্ন উৎসব।`]],
[
"token-classification",
[`আমার নাম জাহিদ এবং আমি ঢাকায় বাস করি।`, `তিনি গুগলে চাকরী করেন।`, `আমার নাম সুস্মিতা এবং আমি কলকাতায় বাস করি।`],
],
["translation", [`আমার নাম জাহিদ, আমি রংপুরে বাস করি।`, `আপনি কী আজকে বাসায় আসবেন?`]],
[
"summarization",
[
`‘ইকোনমিস্ট’ লিখেছে, অ্যান্টিবডির চার মাস স্থায়ী হওয়ার খবরটি দুই কারণে আনন্দের। অ্যান্টিবডি যত দিন পর্যন্ত শরীরে টিকবে, তত দিন সংক্রমণ থেকে সুরক্ষিত থাকা সম্ভব। অর্থাৎ, এমন এক টিকার প্রয়োজন হবে, যা অ্যান্টিবডির উত্পাদনকে প্ররোচিত করতে পারে এবং দীর্ঘস্থায়ী সুরক্ষা দিতে পারে। এগুলো খুঁজে বের করাও সহজ। এটি আভাস দেয়, ব্যাপক হারে অ্যান্টিবডি শনাক্তকরণ ফলাফল মোটামুটি নির্ভুল হওয়া উচিত। দ্বিতীয় আরেকটি গবেষণার নেতৃত্ব দিয়েছেন যুক্তরাজ্যের মেডিকেল রিসার্চ কাউন্সিলের (এমআরসি) ইমিউনোলজিস্ট তাও দং। তিনি টি-সেল শনাক্তকরণে কাজ করেছেন। টি-সেল শনাক্তকরণের প্রক্রিয়া অবশ্য অ্যান্টিবডির মতো এত আলোচিত নয়। তবে সংক্রমণের বিরুদ্ধে লড়াই এবং দীর্ঘমেয়াদি সুরক্ষায় সমান গুরুত্বপূর্ণ ভূমিকা পালন করে। গবেষণাসংক্রান্ত নিবন্ধ প্রকাশিত হয়েছে ‘নেচার ইমিউনোলজি’ সাময়িকীতে। তাঁরা বলছেন, গবেষণার ক্ষেত্রে কোভিড-১৯ মৃদু সংক্রমণের শিকার ২৮ ব্যক্তির রক্তের নমুনা, ১৪ জন গুরুতর অসুস্থ ও ১৬ জন সুস্থ ব্যক্তির রক্তের নমুনা পরীক্ষা করেছেন। গবেষণা নিবন্ধে বলা হয়, সংক্রমিত ব্যক্তিদের ক্ষেত্রে টি-সেলের তীব্র প্রতিক্রিয়া তাঁরা দেখেছেন। এ ক্ষেত্রে মৃদু ও গুরুতর অসুস্থ ব্যক্তিদের ক্ষেত্রে প্রতিক্রিয়ার ভিন্নতা পাওয়া গেছে।`,
],
],
["text-generation", [`আমি রতন এবং আমি`, `তুমি যদি চাও তবে`, `মিথিলা আজকে বড্ড`]],
["fill-mask", [`আমি বাংলায় <mask> গাই।`, `আমি <mask> খুব ভালোবাসি। `]],
[
"question-answering",
[
{
text: `প্রথম এশিয়া কাপ ক্রিকেট টুর্নামেন্ট কোথায় অনুষ্ঠিত হয় ?`,
context: `প্রথম টুর্নামেন্ট অনুষ্ঠিত হয় ১৯৮৪ সালে সংযুক্ত আরব আমিরাত এর শারজাহ তে যেখানে কাউন্সিলের মূল অফিস ছিল (১৯৯৫ পর্যন্ত)। ভারত শ্রীলঙ্কার সাথে আন্তরিকতাহীন ক্রিকেট সম্পর্কের কারণে ১৯৮৬ সালের টুর্নামেন্ট বর্জন করে। ১৯৯৩ সালে ভারত ও পাকিস্তান এর মধ্যে রাজনৈতিক অস্থিরতার কারণে এটি বাতিল হয়ে যায়। শ্রীলঙ্কা এশিয়া কাপ শুরু থেকে অংশ গ্রহণ করে আসছে। আন্তর্জাতিক ক্রিকেট কাউন্সিল নিয়ম করে দিয়েছে যে এশিয়া কাপের সকল খেলা অনুষ্ঠিত হবে অফিসিয়াল একদিনের আন্তর্জাতিক ক্রিকেট হিসেবে। এসিসি ঘোষনা অনুযায়ী প্রতি দুই বছর পর পর টুর্নামেন্ট অনুষ্ঠিত হয় ২০০৮ সাল থেকে।`,
},
{
text: `ভারতীয় বাঙালি কথাসাহিত্যিক মহাশ্বেতা দেবীর মৃত্যু কবে হয় ?`,
context: `২০১৬ সালের ২৩ জুলাই হৃদরোগে আক্রান্ত হয়ে মহাশ্বেতা দেবী কলকাতার বেল ভিউ ক্লিনিকে ভর্তি হন। সেই বছরই ২৮ জুলাই একাধিক অঙ্গ বিকল হয়ে তাঁর মৃত্যু ঘটে। তিনি মধুমেহ, সেপ্টিসেমিয়া ও মূত্র সংক্রমণ রোগেও ভুগছিলেন।`,
},
{
text: `মাস্টারদা সূর্যকুমার সেনের বাবার নাম কী ছিল ?`,
context: `সূর্য সেন ১৮৯৪ সালের ২২ মার্চ চট্টগ্রামের রাউজান থানার নোয়াপাড়ায় অর্থনৈতিক ভাবে অস্বচ্ছল পরিবারে জন্মগ্রহণ করেন। তাঁর পিতার নাম রাজমনি সেন এবং মাতার নাম শশী বালা সেন। রাজমনি সেনের দুই ছেলে আর চার মেয়ে। সূর্য সেন তাঁদের পরিবারের চতুর্থ সন্তান। দুই ছেলের নাম সূর্য ও কমল। চার মেয়ের নাম বরদাসুন্দরী, সাবিত্রী, ভানুমতী ও প্রমিলা। শৈশবে পিতা মাতাকে হারানো সূর্য সেন কাকা গৌরমনি সেনের কাছে মানুষ হয়েছেন। সূর্য সেন ছেলেবেলা থেকেই খুব মনোযোগী ভাল ছাত্র ছিলেন এবং ধর্মভাবাপন্ন গম্ভীর প্রকৃতির ছিলেন।`,
},
],
],
[
"sentence-similarity",
[
{
source_sentence: "সে একজন সুখী ব্যক্তি",
sentences: ["সে হ্যাপি কুকুর", "সে খুব সুখী মানুষ", "আজ একটি রৌদ্রোজ্জ্বল দিন"],
},
],
],
]);
const MAPPING_MN: PerLanguageMapping = new Map([
["text-classification", [`Би чамд хайртай`]],
[
"token-classification",
[
`Намайг Дорж гэдэг. Би Улаанбаатарт амьдардаг.`,
`Намайг Ганбат гэдэг. Би Увс аймагт төрсөн.`,
`Манай улс таван хошуу малтай.`,
],
],
[
"question-answering",
[
{
text: `Та хаана амьдардаг вэ?`,
context: `Намайг Дорж гэдэг. Би Улаанбаатарт амьдардаг.`,
},
{
text: `Таныг хэн гэдэг вэ?`,
context: `Намайг Дорж гэдэг. Би Улаанбаатарт амьдардаг.`,
},
{
text: `Миний нэрийг хэн гэдэг вэ?`,
context: `Намайг Ганбат гэдэг. Би Увс аймагт төрсөн.`,
},
],
],
["translation", [`Намайг Дорж гэдэг. Би Улаанбаатарт амьдардаг.`, `Намайг Ганбат гэдэг. Би Увс аймагт төрсөн.`]],
[
"summarization",
[
`Монгол Улс (1992 оноос хойш) — дорно болон төв Азид оршдог бүрэн эрхт улс. Хойд талаараа Орос, бусад талаараа Хятад улстай хиллэдэг далайд гарцгүй орон. Нийслэл — Улаанбаатар хот. Алтайн нуруунаас Хянган, Соёноос Говь хүрсэн 1 сая 566 мянган км2 уудам нутагтай, дэлхийд нутаг дэвсгэрийн хэмжээгээр 19-рт жагсдаг. 2015 оны эхэнд Монгол Улсын хүн ам 3 сая хүрсэн (135-р олон). Үндсэндээ монгол үндэстэн (95 хувь), мөн хасаг, тува хүн байна. 16-р зуунаас хойш буддын шашин, 20-р зуунаас шашингүй байдал дэлгэрсэн ба албан хэрэгт монгол хэлээр харилцана.`,
],
],
[
"text-generation",
[`Намайг Дорж гэдэг. Би`, `Хамгийн сайн дуучин бол`, `Миний дуртай хамтлаг бол`, `Эрт урьдын цагт`],
],
["fill-mask", [`Монгол улсын <mask> Улаанбаатар хотоос ярьж байна.`, `Миний амьдралын зорилго бол <mask>.`]],
[
"automatic-speech-recognition",
[
{
label: `Common Voice Train Example`,
src: `https://cdn-media.huggingface.co/common_voice/train/common_voice_mn_18577472.wav`,
},
{
label: `Common Voice Test Example`,
src: `https://cdn-media.huggingface.co/common_voice/test/common_voice_mn_18577346.wav`,
},
],
],
[
"text-to-speech",
[
`Би Монгол улсын иргэн.`,
`Энэхүү жишээ нь цаанаа ямар ч утга агуулаагүй болно`,
`Сар шинэдээ сайхан шинэлэж байна уу?`,
],
],
[
"sentence-similarity",
[
{
source_sentence: "Энэ бол аз жаргалтай хүн юм",
sentences: ["Энэ бол аз жаргалтай нохой юм", "Энэ бол маш их аз жаргалтай хүн юм", "Өнөөдөр нарлаг өдөр байна"],
},
],
],
]);
const MAPPING_SI: PerLanguageMapping = new Map([
["translation", [`සිංහල ඉතා අලංකාර භාෂාවකි.`, `මෙම තාක්ෂණය භාවිතා කරන ඔබට ස්තූතියි.`]],
["fill-mask", [`මම ගෙදර <mask>.`, `<mask> ඉගෙනීමට ගියාය.`]],
]);
const MAPPING_DE: PerLanguageMapping = new Map([
[
"question-answering",
[
{
text: `Wo wohne ich?`,
context: `Mein Name ist Wolfgang und ich lebe in Berlin`,
},
{
text: `Welcher Name wird auch verwendet, um den Amazonas-Regenwald auf Englisch zu beschreiben?`,
context: `Der Amazonas-Regenwald, auf Englisch auch als Amazonien oder Amazonas-Dschungel bekannt, ist ein feuchter Laubwald, der den größten Teil des Amazonas-Beckens Südamerikas bedeckt. Dieses Becken umfasst 7.000.000 Quadratkilometer (2.700.000 Quadratmeilen), von denen 5.500.000 Quadratkilometer (2.100.000 Quadratmeilen) vom Regenwald bedeckt sind. Diese Region umfasst Gebiete von neun Nationen. Der größte Teil des Waldes befindet sich in Brasilien mit 60% des Regenwaldes, gefolgt von Peru mit 13%, Kolumbien mit 10% und geringen Mengen in Venezuela, Ecuador, Bolivien, Guyana, Suriname und Französisch-Guayana. Staaten oder Abteilungen in vier Nationen enthalten "Amazonas" in ihren Namen. Der Amazonas repräsentiert mehr als die Hälfte der verbleibenden Regenwälder des Planeten und umfasst den größten und artenreichsten tropischen Regenwald der Welt mit geschätzten 390 Milliarden Einzelbäumen, die in 16.000 Arten unterteilt sind.`,
},
],
],
[
"sentence-similarity",
[
{
source_sentence: "Das ist eine glückliche Person",
sentences: [
"Das ist ein glücklicher Hund",
"Das ist eine sehr glückliche Person",
"Heute ist ein sonniger Tag",
],
},
],
],
]);
const MAPPING_DV: PerLanguageMapping = new Map([
["text-classification", [`އަހަރެން ގަޔާވޭ. އަހަރެން ލޯބިވޭ`]],
[
"token-classification",
[
`އަހަރެންގެ ނަމަކީ އަހުމަދު އަދި އަހަރެން ދިރިއުޅެނީ މާލޭގަ`,
`އަހަރެންގެ ނަމަކީ ސާރާ އަދި އަހަރެން ދިރިއުޅެނީ އުތީމުގަ`,
`އަހަރެންގެ ނަމަކީ އައިޝާ އަދި އަހަރެން ދިރިއުޅެނީ ފޭދޫ، އައްޑޫގަ`,
],
],
[
"question-answering",
[
{
text: `އަހަރެން ދިރިއުޅެނީ ކޮންތާކު؟`,
context: `އަހަރެންގެ ނަމަކީ އަހުމަދު އަދި އަހަރެން ދިރިއުޅެނީ މާލޭގަ`,
},
{
text: `އަހަރެން ދިރިއުޅެނީ ކޮންތާކު؟`,
context: `އަހަރެންގެ ނަމަކީ ސާރާ އަދި އަހަރެން ދިރިއުޅެނީ އުތީމުގަ`,
},
{
text: `އަހަރެންގެ ނަމަކީ ކޮބާ؟`,
context: `އަހަރެންގެ ނަމަކީ އައިޝާ އަދި އަހަރެން ދިރިއުޅެނީ ފޭދޫގަ`,
},
{
text: `އެމޭޒަން ރެއިންފޮރެސްޓް ސިފަކޮށްދިނުމަށް އިނގިރޭސި ބަހުން ބޭނުންކުރާނީ ކޮންނަމެއް؟`,
context: `އެމޭޒަން ރެއިންފޮރެސްޓް (ޕޯޗުޖީޒް: ފްލޮރެސްޓާ އެމަސޮނިކާ ނުވަތަ އެމަސޮނިއާ؛ ސްޕެނިޝް: ސެލްވާ އެމަސޮނިކާ, އެމަސޮނިއާ ނޫނީ އާންމުކޮށް އެމަޒޯނިއާ؛ ފްރެންޗް: ފޮރޭ އެމެޒޮނިއެން؛ ޑަޗް: އެމެޒޯންރޭގެވައުޑް)، އިގިރޭސި ބަހުން ބުނާ އެމެޒޯނިއާ ނުވަތަ ދަ އެމޭޒަން ޖަންގަލް އަކީ, ސައުތު އެމެރިކާގެ އެމޭޒަން ބޭސިން ސަރަހައްދުގެ ބޮޑުބައެއްގައި ހިމެނޭ މޮއިސްޓް ބޮރޯޑްލީފް ފޮރެސްޓެއެކެވެ. އެމޭޒަން ބޭސިން ސަރަހައްދުގެ ބޮޑު މިނަކީ 7 މިލިއަން އަކަ ކިލޯމީޓަރ (2.7 މިލިއަން އަކަ މައިލް(. މީގެ ތެރެއިން 5.5 މިލިއަން އަކަ ކިލޯމީޓަރ (2.1 މިލިއަން އަކަ މައިލް) އަކީ މި ފޮރެސްޓެވެ. މި ސަރަހައްދުގައި 9 ގައުމަކަށް ނިސްބަތްވާ ޓެރިޓަރީ ހިމެނެއެވެ. 60% އާއިއެކެ އެންމެ ބޮޑު ބައެއް ނިސްބަތްވަނީ ބްރެޒިލްއަށެވެ. އޭގެ ފަހުތުން 13% އާއެކު ޕެރޫ އާއި 10% އާއެކު ކޮލަމްބިއާ އަދި ކުޑަ ބައެއް ހިމެނޭ ގޮތުން ވެނެޒުއެލާ, އެކްއަޑޯ, ބޮލިވިއާ, ގުޔާނާ, ސުރިނާމް އަދި ފްރެންޗް ގްއާނާ އަށް ވެސް ނިސްބަތްވެއެވެ. މީގެ ތެރެއިން 4 ގައުމެއްގައި "އެމެޒޮނާސް" ހިމަނައިގެން ސްޓޭޓް ނުވަތަ ޑިޕާޓްމަންޓް އަކަށް ނަންދީފައިވެއެވެ. މުޅި ދުނިޔޭގައި ބާކީ ހުރި ރެއިންފޮރެސްޓްގެ ތެރެއިން ދެބައިކުޅަ އެއްބަޔަށްވުރެބޮޑުވަރެއް އެމޭޒޮން ރެއިންފޮރެސްޓް ހިއްސާކުރެއެވެ. މިއީ މުޅި ދުނިޔެއިން އެންމޮ ބޮޑު އަދި އެންމެ ބައޮޑައިވަރސް ރެއިންފޮރެސްޓް ޓްރެކްޓެވެ. ލަފާކުރެވޭ ގޮތުން 16 ހާސް ސްޕީޝީސްއަށް ބެހިގެންވާ 390 މިލިއަން ވައްތަރުގެ ގަސް މިތާގައި ހިމެނެއެވެ`,
},
],
],
[
"translation",
[
`އަހަރެންގެ ނަމަކީ އަހުމަދު އަދި އަހަރެން ދިރިއުޅެނީ މާލޭގަ`,
`އަހަރެންގެ ނަމަކީ ސާރާ އަދި އަހަރެން ދިރިއުޅެނީ އުތީމުގަ`,
],
],
[
"summarization",
[
`ޓަވަރުގެ އުސްމިނަކީ 324 މީޓަރު، އެއީ ގާތްގަނޑަކަށް 81 ބުރީގެ އިމާރާތަކާއި އެއްވަރެވެ. އެއީ ޕެރިސްގައި ހުރި އެންމެ އުސް އިމާރާތެވެ. އޭގެ ހަތަރެސްކަނަށް ހުރި ބުޑުގެ ދިގުމިނަކީ ކޮންމެ ފަރާތަކުން 125 މީޓަރެވެ. (410 ފޫޓު) އައިފިލް ޓަވަރު ބިނާކުރި އިރު، ވޮޝިންގްޓަން މޮނިއުމެންޓްގެ އުސްމިން ފަހަނައަޅާ ގޮސް، ދުނިޔޭގައި މީހުން އުފެއްދި ތަންތަނުގެ ތެރެއިން އެންމެ އުސް ތަނުގެ ލަގަބު ލިބުނެވެ. އަދި 1930 ގައި ނިއު ޔޯކްގެ ކްރައިސްލަރ ބިލްޑިންގް ބިނާކުރުމާއި ހަމައަށް 41 އަހަރު ވަންދެން މިލަގަބު ހިފެހެއްޓިއެވެ. މިއީ 300 މީޓަރަށް ވުރެ އުސްކޮށް އިމާރާތްކުރެވުނު ފުރަތަމަ ތަނެވެ. 1957 ގައި ޓަވަރުގެ އެންމެ މަތީގައި ހަރުކުރެވުނު ބްރޯޑްކާސްޓިންގ އޭރިއަލްގެ ސަބަބުން މިހާރު މި ޓަވަރު ކްރައިސްލަރ ބިލްޑިންގއަށް ވުރެ 5.2 މީޓަރ (17 ފޫޓު) އުހެވެ. މި ޓްރާންސްމިޓަރު ނުލާ، އައިފިލް ޓަވަރަކީ، މިލާއު ވިއާޑަކްޓަށް ފަހު ފްރާންސްގައި ހުރި 2 ވަނައަށް އެންމެ އުސް ފްރީސްޓޭންޑިންގ އިމާރާތެވެ`,
],
],
[
"text-generation",
[
`އަހަރެންގެ ނަމަކީ ޔޫސުފް އަދި އަހަރެންގެ މައިގަނޑު`,
`އަހަރެންގެ ނަމަކީ މަރިއަމް، އަހަރެން އެންމެ ގަޔާވާ`,
`އަހަރެންގެ ނަމަކީ ފާތުމަތު އަދި އަހަރެން`,
`،އެއް ޒަމާނެއްގައި`,
],
],
["fill-mask", [`.<mask> މާލެ އަކީ ދިވެހިރާއްޖޭގެ`, `ގަރުދިޔައަކީ ދިވެހިންގެ މެދުގައި <mask> ކެއުމެއް.`]],
]);
export const MAPPING_DEFAULT_WIDGET = new Map<LanguageCode, PerLanguageMapping>([
["en", MAPPING_EN],
["zh", MAPPING_ZH],
["fr", MAPPING_FR],
["es", MAPPING_ES],
["ru", MAPPING_RU],
["uk", MAPPING_UK],
["it", MAPPING_IT],
["fa", MAPPING_FA],
["ar", MAPPING_AR],
["bn", MAPPING_BN],
["mn", MAPPING_MN],
["si", MAPPING_SI],
["de", MAPPING_DE],
["dv", MAPPING_DV],
]);
|