Spaces:
Running
Running
Yurii Paniv
commited on
Commit
·
8253e81
1
Parent(s):
55d834b
Improve handling
Browse files- converter.py +15 -1
- tests/rosetta.csv +1 -1
converter.py
CHANGED
|
@@ -40,8 +40,22 @@ def to_latin(text):
|
|
| 40 |
"ы": "ı",
|
| 41 |
"ь": "",
|
| 42 |
"э": "e",
|
| 43 |
-
"ю": "
|
| 44 |
"я": "ya",
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 45 |
}
|
| 46 |
|
| 47 |
for key in sorted(cyrillic_mapping.keys(), key=lambda x: len(x), reverse=True):
|
|
|
|
| 40 |
"ы": "ı",
|
| 41 |
"ь": "",
|
| 42 |
"э": "e",
|
| 43 |
+
"ю": "ü",
|
| 44 |
"я": "ya",
|
| 45 |
+
"ку": "kü", # non-letter replacements starts here
|
| 46 |
+
"узю": "üzü",
|
| 47 |
+
"ур": "ür",
|
| 48 |
+
"ля": "lâ",
|
| 49 |
+
"уту": "utu",
|
| 50 |
+
"ие": "iye",
|
| 51 |
+
"ко": "kö",
|
| 52 |
+
"мю": "mü",
|
| 53 |
+
"ол": "öl",
|
| 54 |
+
"къу": "qu",
|
| 55 |
+
"cю": "sü",
|
| 56 |
+
"ёкъ": "yoq",
|
| 57 |
+
"юв": "yuv",
|
| 58 |
+
"уз": "üz",
|
| 59 |
}
|
| 60 |
|
| 61 |
for key in sorted(cyrillic_mapping.keys(), key=lambda x: len(x), reverse=True):
|
tests/rosetta.csv
CHANGED
|
@@ -14,7 +14,7 @@ Dua etip tek o zaman|Дуа этип тек о заман
|
|
| 14 |
Çıqarım arş-alâğa, Oña qadar mende yoqtır|Чыкъарым арш-алягъа, Онъа къадар менде ёкътыр
|
| 15 |
İşanç Alla-Taalâğa.|Ишанч Алла-Таалягъа.
|
| 16 |
Meni cıyıp, qalqıñız ve|Мени джыйып, къалкъынъыз ве
|
| 17 |
-
Üzüñiz buğavlarn
|
| 18 |
Zalım duşman qanı ile|Залым душман къаны иле
|
| 19 |
Yuvuñız diyarlarnı,|Ювунъыз диярларны,
|
| 20 |
Ulu, ür bir ailege|Улу, урь бир аилеге
|
|
|
|
| 14 |
Çıqarım arş-alâğa, Oña qadar mende yoqtır|Чыкъарым арш-алягъа, Онъа къадар менде ёкътыр
|
| 15 |
İşanç Alla-Taalâğa.|Ишанч Алла-Таалягъа.
|
| 16 |
Meni cıyıp, qalqıñız ve|Мени джыйып, къалкъынъыз ве
|
| 17 |
+
Üzüñiz buğavlarnı|Узюнъиз бугъавларны
|
| 18 |
Zalım duşman qanı ile|Залым душман къаны иле
|
| 19 |
Yuvuñız diyarlarnı,|Ювунъыз диярларны,
|
| 20 |
Ulu, ür bir ailege|Улу, урь бир аилеге
|