Spaces:
Sleeping
Sleeping
Update replaceWords.py
Browse files- replaceWords.py +121 -133
replaceWords.py
CHANGED
@@ -1,133 +1,121 @@
|
|
1 |
-
|
2 |
-
|
3 |
-
|
4 |
-
|
5 |
-
|
6 |
-
|
7 |
-
|
8 |
-
|
9 |
-
'
|
10 |
-
'
|
11 |
-
'
|
12 |
-
'
|
13 |
-
|
14 |
-
'
|
15 |
-
'
|
16 |
-
'
|
17 |
-
'
|
18 |
-
'
|
19 |
-
|
20 |
-
'
|
21 |
-
'
|
22 |
-
'
|
23 |
-
|
24 |
-
'
|
25 |
-
'
|
26 |
-
'
|
27 |
-
'
|
28 |
-
'
|
29 |
-
|
30 |
-
'twenty': ['ഇരുപത്', '
|
31 |
-
'twenty
|
32 |
-
'twenty
|
33 |
-
'twenty
|
34 |
-
|
35 |
-
'
|
36 |
-
'
|
37 |
-
'
|
38 |
-
'
|
39 |
-
'
|
40 |
-
|
41 |
-
'thirty': ['മുപ്പത്', '
|
42 |
-
'thirty
|
43 |
-
'thirty
|
44 |
-
'thirty
|
45 |
-
|
46 |
-
'
|
47 |
-
'
|
48 |
-
'
|
49 |
-
'
|
50 |
-
'
|
51 |
-
|
52 |
-
'forty': ['നാല്പത്', '
|
53 |
-
'forty
|
54 |
-
'forty
|
55 |
-
'forty
|
56 |
-
|
57 |
-
'
|
58 |
-
'
|
59 |
-
'
|
60 |
-
'
|
61 |
-
'
|
62 |
-
|
63 |
-
'fifty': ['അമ്പത്', '
|
64 |
-
'fifty
|
65 |
-
'fifty
|
66 |
-
'fifty
|
67 |
-
|
68 |
-
'
|
69 |
-
'
|
70 |
-
'
|
71 |
-
'
|
72 |
-
'
|
73 |
-
|
74 |
-
'sixty': ['
|
75 |
-
'sixty
|
76 |
-
'sixty
|
77 |
-
'sixty
|
78 |
-
|
79 |
-
'
|
80 |
-
'
|
81 |
-
'
|
82 |
-
'
|
83 |
-
'
|
84 |
-
|
85 |
-
'seventy': ['എഴുപത്', '
|
86 |
-
'seventy
|
87 |
-
'seventy
|
88 |
-
'seventy
|
89 |
-
|
90 |
-
'
|
91 |
-
'
|
92 |
-
'
|
93 |
-
'
|
94 |
-
'
|
95 |
-
|
96 |
-
'eighty': ['എൺപത്', '
|
97 |
-
'eighty
|
98 |
-
'eighty
|
99 |
-
'eighty
|
100 |
-
|
101 |
-
'
|
102 |
-
'
|
103 |
-
'
|
104 |
-
'
|
105 |
-
'
|
106 |
-
|
107 |
-
|
108 |
-
'
|
109 |
-
|
110 |
-
|
111 |
-
|
112 |
-
|
113 |
-
|
114 |
-
|
115 |
-
|
116 |
-
|
117 |
-
|
118 |
-
|
119 |
-
#
|
120 |
-
|
121 |
-
|
122 |
-
if word in patterns:
|
123 |
-
words[i] = replacement # Replace the word if it's fully matched
|
124 |
-
|
125 |
-
# Join the processed words back into a sentence
|
126 |
-
return ' '.join(words)
|
127 |
-
|
128 |
-
|
129 |
-
# In[ ]:
|
130 |
-
|
131 |
-
|
132 |
-
|
133 |
-
|
|
|
1 |
+
import re
|
2 |
+
malayalam_numbers = {
|
3 |
+
'one': ['ഒന്ന്', 'ഒന്നു', 'വൺ'],
|
4 |
+
'two': ['രണ്ട്', 'രണ്ടും', 'ടൂ'],
|
5 |
+
'three': ['മൂന്ന്', 'മുന്ന്', 'ത്രീ'],
|
6 |
+
'four': ['നാല്', 'നാലു', 'ഫോർ'],
|
7 |
+
'five': ['അഞ്ച്', 'അഞ്ചു', 'ഫൈവ്'],
|
8 |
+
'six': ['ആറ്', 'ആறு', 'സിക്സ്'],
|
9 |
+
'seven': ['ഏഴ്', 'എഴു', 'സെവൻ'],
|
10 |
+
'eight': ['എട്ട്', 'എട്ട്', 'എയ്റ്റ്'],
|
11 |
+
'nine': ['ഒമ്പത്', 'ഒമ്പതു', 'നൈൻ'],
|
12 |
+
'ten': ['പത്ത്', 'പത്തുപാട്', 'ടെൻ'],
|
13 |
+
|
14 |
+
'eleven': ['പതിനൊന്ന്', 'പതിനൊന്നും', 'എലവൻ'],
|
15 |
+
'twelve': ['പന്നിരണ്ട്', 'പന്നിരണ്ടും', 'ട്വെൽവ്'],
|
16 |
+
'thirteen': ['പതിന്മൂന്ന്', 'പതിന്മുന്ന്', 'തർതീൻ'],
|
17 |
+
'fourteen': ['പതിനാല്', 'പതിനാലു', 'ഫോർടheen'],
|
18 |
+
'fifteen': ['പതിനഞ്ച്', 'പതിനഞ്ചു', 'ഫിഫ്റ്റീൻ'],
|
19 |
+
'sixteen': ['പതിനാറ്', 'പതിനാറു', 'സിക്സ്റ്റീൻ'],
|
20 |
+
'seventeen': ['പതിനേഴ്', 'പതിനേഴ്', 'സെവന്റീൻ'],
|
21 |
+
'eighteen': ['പതിനെട്ട്', 'പതിനെട്ടു', 'എറ്റിൻ'],
|
22 |
+
'nineteen': ['പതൊമ്പത്', 'പത്തൊമ്പതു', 'നൈന്റീൻ'],
|
23 |
+
|
24 |
+
'twenty': ['ഇരുപത്', 'ഇരുപത്തൊ', 'ട്വെന്റി'],
|
25 |
+
'twenty one': ['ഇരുപത് ഒന്ന്', 'ഇരുപതൊന്ന്', 'ട്വെന്റി വൺ'],
|
26 |
+
'twenty two': ['ഇരുപത് രണ്ട്', 'ഇരുപതുള്ള്', 'ട്വെന്റി ടൂ'],
|
27 |
+
'twenty three': ['ഇരുപത് മൂന്ന്', 'ഇരുപത്തുമൂന്ന്', 'ട്വെന്റി ത്രീ'],
|
28 |
+
'twenty four': ['ഇരുപത് നാല്', 'ഇരുപത്തുനാല്', 'ട്വെന്റി ഫോർ'],
|
29 |
+
'twenty five': ['ഇരുപത് അഞ്ച്', 'ഇരുപത്തുഐന്ന്', 'ട്വെന്റി ഫൈവ്'],
|
30 |
+
'twenty six': ['ഇരുപത് ആറ്', 'ഇരുപത്തുആറ്', 'ട്വെന്റി സിക്സ്'],
|
31 |
+
'twenty seven': ['ഇരുപത് ഏഴ്', 'ഇരുപത്തുഏഴ്', 'ട്വെന്റി സെവൻ'],
|
32 |
+
'twenty eight': ['ഇരുപത് എട്ട്', 'ഇരുപത്തുഎട്ട്', 'ട്���െന്റി എയ്റ്റ്'],
|
33 |
+
'twenty nine': ['ഇരുപത് ഒമ്പത്', 'ഇരുപത്തൊമ്പത്', 'ട്വെന്റി നൈൻ'],
|
34 |
+
|
35 |
+
'thirty': ['മുപ്പത്', 'മുപ്പത്തൊ', 'തർട്ടി'],
|
36 |
+
'thirty one': ['മുപ്പത് ഒന്ന്', 'മുപ്പത്തൊന്ന്', 'തർട്ടി വൺ'],
|
37 |
+
'thirty two': ['മുപ്പത് രണ്ട്', 'മുപ്പത്തുള്ള്', 'തർട്ടി ടൂ'],
|
38 |
+
'thirty three': ['മുപ്പത് മൂന്ന്', 'മുപ്പത്തുമൂന്ന്', 'തർട്ടി ത്രീ'],
|
39 |
+
'thirty four': ['മുപ്പത് നാല്', 'മുപ്പത്തുനാൽ', 'തർട്ടി ഫോർ'],
|
40 |
+
'thirty five': ['മുപ്പത് അഞ്ച്', 'മുപ്പത്തുഐന്ന്', 'തർട്ടി ഫൈവ്'],
|
41 |
+
'thirty six': ['മുപ്പത് ആറ്', 'മുപ്പത്തുആറ്', 'തർട്ടി സിക്സ്'],
|
42 |
+
'thirty seven': ['മുപ്പത് ഏഴ്', 'മുപ്പത്തുഏഴ്', 'തർട്ടി സെവൻ'],
|
43 |
+
'thirty eight': ['മുപ്പത് എട്ട്', 'മുപ്പത്തുഎട്ട്', 'തർട്ടി എയ്റ്റ്'],
|
44 |
+
'thirty nine': ['മുപ്പത് ഒമ്പത്', 'മുപ്പത്തൊമ്പത്', 'തർട്ടി നൈൻ'],
|
45 |
+
|
46 |
+
'forty': ['നാല്പത്', 'നാല്പത്തൊ', 'ഫോർട്ടി'],
|
47 |
+
'forty one': ['നാല്പത് ഒന്ന്', 'നാല്പത്തൊന്ന്', 'ഫോർട്ടി വൺ'],
|
48 |
+
'forty two': ['നാല്പത് രണ്ട്', 'നാല്പത്തുള്ള്', 'ഫോർട്ടി ടൂ'],
|
49 |
+
'forty three': ['നാല്പത് മൂന്ന്', 'നാല്പത്തുമൂന്ന്', 'ഫോർട്ടി ത്രീ'],
|
50 |
+
'forty four': ['നാല്പത് നാല്', 'നാല്പത്തുനാൽ', 'ഫോർട്ടി ഫോർ'],
|
51 |
+
'forty five': ['നാല്പത് അഞ്ച്', 'നാല്പത്തുഐന്ന്', 'ഫോർട്ടി ഫൈവ്'],
|
52 |
+
'forty six': ['നാല്പത് ആറ്', 'നാല്പത്തുആറ്', 'ഫോർട്ടി സിക്സ്'],
|
53 |
+
'forty seven': ['നാല്പത് ഏഴ്', 'നാല്പത്തുഏഴ്', 'ഫോർട്ടി സെവൻ'],
|
54 |
+
'forty eight': ['നാല്പത് എട്ട്', 'നാല്പത്തുഎട്ട്', 'ഫോർട്ടി എയ്റ്റ്'],
|
55 |
+
'forty nine': ['നാല്പത് ഒമ്പത്', 'നാല്പത്തൊമ്പത്', 'ഫോർട്ടി നൈൻ'],
|
56 |
+
|
57 |
+
'fifty': ['അമ്പത്', 'അമ്പത്തൊ', 'ഫിഫ്റ്റി'],
|
58 |
+
'fifty one': ['അമ്പത് ഒന്ന്', 'അമ്പത്തൊന്ന്', 'ഫിഫ്റ്റി വൺ'],
|
59 |
+
'fifty two': ['അമ്പത് രണ്ട്', 'അമ്പത്തുള്ള്', 'ഫിഫ്റ്റി ടൂ'],
|
60 |
+
'fifty three': ['അമ്പത് മൂന്ന്', 'അമ്പത്തുമൂന്ന്', 'ഫിഫ്റ്റി ത്രീ'],
|
61 |
+
'fifty four': ['അമ്പത് നാല്', 'അമ്പത്തുനാൽ', 'ഫിഫ്റ്റി ഫോർ'],
|
62 |
+
'fifty five': ['അമ്പത് അഞ്ചു', 'അമ്പത്തുഐന്ന്', 'ഫിഫ്റ്റി ഫൈവ്'],
|
63 |
+
'fifty six': ['അമ്പത് ആറ്', 'അമ്പത്തുആറ്', 'ഫിഫ്റ്റി സിക്സ്'],
|
64 |
+
'fifty seven': ['അമ്പത് ഏഴ്', 'അമ്പത്തുഏഴ്', 'ഫിഫ്റ്റി സെവൻ'],
|
65 |
+
'fifty eight': ['അമ്പത് എട്ട്', 'അമ്പത്തുഎട്ട്', 'ഫിഫ്റ്റി എയ്റ്റ്'],
|
66 |
+
'fifty nine': ['അമ്പത് ഒമ്പത്', 'അമ്പത്തൊമ്പത്', 'ഫിഫ്റ്റി നൈൻ'],
|
67 |
+
|
68 |
+
'sixty': ['അറുപത്', 'അറുപത്തൊ', 'സിക്സ്റ്റി'],
|
69 |
+
'sixty one': ['അറുപത് ഒന്ന്', 'അറുപത് ഒന്നു', 'സിക്സ്റ്റി വൺ'],
|
70 |
+
'sixty two': ['അറുപത് രണ്ട്', 'അറുപത് രണ്ട്', 'സിക്സ്റ്റി ടൂ'],
|
71 |
+
'sixty three': ['അറുപത് മൂന്ന്', 'അറുപത് മൂന്ന്', 'സിക്സ്റ്റി ത്രീ'],
|
72 |
+
'sixty four': ['അറുപത് നാല്', 'അറുപത് നാല്', 'സിക്സ്റ്റി ഫോർ'],
|
73 |
+
'sixty five': ['അറുപത് അഞ്ച്', 'അറുപത് അഞ്ചു', 'സിക്സ്റ്റി ഫൈവ്'],
|
74 |
+
'sixty six': ['അ��ുപത് ആറ്', 'അറുപത് ആരു', 'സിക്സ്റ്റി സിക്സ്'],
|
75 |
+
'sixty seven': ['അറുപത് ഏഴ്', 'അറുപത് ഏഴ്', 'സിക്സ്റ്റി സെവൻ'],
|
76 |
+
'sixty eight': ['അറുപത് എട്ട്', 'അറുപത് എട്ട്', 'സിക്സ്റ്റി എയ്റ്റ്'],
|
77 |
+
'sixty nine': ['അറുപത് ഒമ്പത്', 'അറുപത് ഒമ്പതു', 'സിക്സ്റ്റി നൈൻ'],
|
78 |
+
|
79 |
+
'seventy': ['എഴുപത്', 'എഴുപത്തൊ', 'സെവന്റി'],
|
80 |
+
'seventy one': ['എഴുപത് ഒന്ന്', 'എഴുപത് ഒന്നു', 'സെവന്റി വൺ'],
|
81 |
+
'seventy two': ['എഴുപത് രണ്ട്', 'എഴുപത് രണ്ട്', 'സെവന്റി ടൂ'],
|
82 |
+
'seventy three': ['എഴുപത് മൂന്ന്', 'എഴുപത് മൂന്ന്', 'സെവന്റി ത്രീ'],
|
83 |
+
'seventy four': ['എഴുപത് നാല്', 'എഴുപത് നാല്', 'സെവന്റി ഫോർ'],
|
84 |
+
'seventy five': ['എഴുപത് അഞ്ച്', 'എഴുപത് അഞ്ചു', 'സെവന്റി ഫൈവ്'],
|
85 |
+
'seventy six': ['എഴുപത് ആറ്', 'എഴുപത് ആരു', 'സെവന്റി സിക്സ്'],
|
86 |
+
'seventy seven': ['എഴുപത് ഏഴ്', 'എഴുപത് ഏഴ്', 'സെവന്റി സെവൻ'],
|
87 |
+
'seventy eight': ['എഴുപത് എട്ട്', 'എഴുപത് എട്ട്', 'സെവന്റി എയ്റ്റ്'],
|
88 |
+
'seventy nine': ['എഴുപത് ഒമ്പത്', 'എഴുപത് ഒമ്പതു', 'സെവന്റി നൈൻ'],
|
89 |
+
|
90 |
+
'eighty': ['എൺപത്', 'എൺപത്തൊ', 'എയ്റ്റി'],
|
91 |
+
'eighty one': ['എൺപത് ഒന്ന്', 'എൺപത് ഒന്നു', 'എയ്റ്റി വൺ'],
|
92 |
+
'eighty two': ['എൺപത് രണ്ട്', 'എൺപത് രണ്ട്', 'എയ്റ്റി ടൂ'],
|
93 |
+
'eighty three': ['എൺപത് മൂന്ന്', 'എൺപത് മൂന്ന്', 'എയ്റ്റി ത്രീ'],
|
94 |
+
'eighty four': ['എൺപത് നാല്', 'എൺപത് നാല്', 'എയ്റ്റി ഫോർ'],
|
95 |
+
'eighty five': ['എൺപത് അഞ്ച്', 'എൺപത് അഞ്ചു', 'എയ്റ്റി ഫൈവ്'],
|
96 |
+
'eighty six': ['എൺപത് ആറ്', 'എൺപത് ആറ്', 'എയ്റ്റി സിക്സ്'],
|
97 |
+
'eighty seven': ['എൺപത് ഏഴ്', 'എൺപത് ഏഴ്', 'എയ്റ്റി സെവൻ'],
|
98 |
+
'eighty eight': ['എൺപത് എട്ട്', 'എൺപത് എട്ട്', 'എയ്റ്റി എയ്റ്റ്'],
|
99 |
+
'eighty nine': ['എൺപത് ഒമ്പത്', 'എൺപത് ഒമ്പതു', 'എയ്റ്റി നൈൻ'],
|
100 |
+
|
101 |
+
'ninety': ['തൊണ്ണൂറി', 'തൊണ്ണൂറി', 'നൈന്റ്റി'],
|
102 |
+
'ninety one': ['തൊണ്ണൂറി ഒന്ന്', 'തൊണ്ണൂറി ഒന്നു', 'നൈന്റ്റി വൺ'],
|
103 |
+
'ninety two': ['തൊണ്ണൂറി രണ്ട്', 'തൊണ്ണൂറി രണ്ട്', 'നൈന്റ്റി ടൂ'],
|
104 |
+
'ninety three': ['തൊണ്ണൂറി മൂന്ന്', 'തൊണ്ണൂറി മൂന്ന്', 'നൈന്റ്റി ത്രീ'],
|
105 |
+
'ninety four': ['തൊണ്ണൂറി четыре', 'തൊണ്ണൂറി', 'നൈന്റ്റി ഫോർ'],
|
106 |
+
'ninety five': ['തൊണ്ണൂറി five', 'തൊണ്ണൂറി', 'നൈന്റ്റി 5'],
|
107 |
+
|
108 |
+
'hundred': ['നൂറ്', 'നൂറ്', 'ഹണ്ട്രഡ്'],
|
109 |
+
}
|
110 |
+
|
111 |
+
words = sentence.split() # Split the sentence by spaces
|
112 |
+
|
113 |
+
# Replace words using the mapping
|
114 |
+
for i, word in enumerate(words):
|
115 |
+
for replacement, patterns in replacement_map.items():
|
116 |
+
if word in patterns:
|
117 |
+
words[i] = replacement # Replace the word if it's fully matched
|
118 |
+
|
119 |
+
# Join the processed words back into a sentence
|
120 |
+
return ' '.join(words)
|
121 |
+
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|