Spaces:
Sleeping
Sleeping
Update replaceWords.py
Browse files- replaceWords.py +141 -153
replaceWords.py
CHANGED
@@ -1,153 +1,141 @@
|
|
1 |
-
|
2 |
-
|
3 |
-
|
4 |
-
#
|
5 |
-
|
6 |
-
|
7 |
-
|
8 |
-
|
9 |
-
|
10 |
-
|
11 |
-
'
|
12 |
-
'
|
13 |
-
'
|
14 |
-
'
|
15 |
-
'
|
16 |
-
|
17 |
-
|
18 |
-
'
|
19 |
-
'
|
20 |
-
'
|
21 |
-
|
22 |
-
|
23 |
-
'
|
24 |
-
'
|
25 |
-
'
|
26 |
-
'
|
27 |
-
|
28 |
-
|
29 |
-
'
|
30 |
-
'
|
31 |
-
'
|
32 |
-
|
33 |
-
|
34 |
-
'
|
35 |
-
'
|
36 |
-
'
|
37 |
-
|
38 |
-
|
39 |
-
'
|
40 |
-
'
|
41 |
-
'
|
42 |
-
|
43 |
-
|
44 |
-
'twenty
|
45 |
-
'twenty
|
46 |
-
'twenty
|
47 |
-
'twenty
|
48 |
-
|
49 |
-
|
50 |
-
'
|
51 |
-
'
|
52 |
-
'
|
53 |
-
|
54 |
-
|
55 |
-
'thirty
|
56 |
-
'thirty
|
57 |
-
'thirty
|
58 |
-
'thirty
|
59 |
-
|
60 |
-
|
61 |
-
'
|
62 |
-
'
|
63 |
-
'
|
64 |
-
|
65 |
-
|
66 |
-
'forty
|
67 |
-
'forty
|
68 |
-
'forty
|
69 |
-
'forty
|
70 |
-
|
71 |
-
|
72 |
-
'
|
73 |
-
'
|
74 |
-
'
|
75 |
-
|
76 |
-
|
77 |
-
'fifty
|
78 |
-
'fifty
|
79 |
-
'fifty
|
80 |
-
'fifty
|
81 |
-
|
82 |
-
|
83 |
-
'
|
84 |
-
'
|
85 |
-
'
|
86 |
-
|
87 |
-
|
88 |
-
'sixty
|
89 |
-
'sixty
|
90 |
-
'sixty
|
91 |
-
'sixty
|
92 |
-
|
93 |
-
|
94 |
-
'
|
95 |
-
'
|
96 |
-
'
|
97 |
-
|
98 |
-
|
99 |
-
'seventy
|
100 |
-
'seventy
|
101 |
-
'seventy
|
102 |
-
'seventy
|
103 |
-
|
104 |
-
|
105 |
-
'
|
106 |
-
'
|
107 |
-
'
|
108 |
-
|
109 |
-
|
110 |
-
'eighty
|
111 |
-
'eighty
|
112 |
-
'eighty
|
113 |
-
'eighty
|
114 |
-
|
115 |
-
|
116 |
-
'
|
117 |
-
'
|
118 |
-
'
|
119 |
-
|
120 |
-
|
121 |
-
'ninety
|
122 |
-
'ninety
|
123 |
-
'ninety
|
124 |
-
'ninety
|
125 |
-
|
126 |
-
|
127 |
-
'
|
128 |
-
|
129 |
-
'
|
130 |
-
|
131 |
-
|
132 |
-
|
133 |
-
|
134 |
-
|
135 |
-
|
136 |
-
|
137 |
-
|
138 |
-
|
139 |
-
|
140 |
-
|
141 |
-
|
142 |
-
if word in patterns:
|
143 |
-
words[i] = replacement # Replace the word if it's fully matched
|
144 |
-
|
145 |
-
# Join the processed words back into a sentence
|
146 |
-
return ' '.join(words)
|
147 |
-
|
148 |
-
|
149 |
-
# In[ ]:
|
150 |
-
|
151 |
-
|
152 |
-
|
153 |
-
|
|
|
1 |
+
import re
|
2 |
+
def replace_words(sentence):
|
3 |
+
replacement_map = {
|
4 |
+
# Single digits
|
5 |
+
'zero':['பூஜ்யம்','சுழியம்'],
|
6 |
+
'one': ['ஒன்று', 'ஒன்னு', 'ஒன்'],
|
7 |
+
'two': ['இரண்டு', 'ரெண்டு', 'டூ'],
|
8 |
+
'three': ['மூன்று', 'முன்னு', 'த்ரீ'],
|
9 |
+
'four': ['நான்கு', 'நாலு', 'ஃபோர்'],
|
10 |
+
'five': ['ஐந்து', 'அஞ்சு', 'ஃபைவ்'],
|
11 |
+
'six': ['ஆறு', 'ஆறு', 'சிக்ஸ்'],
|
12 |
+
'seven': ['ஏழு', 'எழு', 'செவன்'],
|
13 |
+
'eight': ['எட்டு', 'எட்டு', 'எய்ட்'],
|
14 |
+
'nine': ['ஒன்பது', 'ஒம்பது', 'நைன்'],
|
15 |
+
'ten': ['பத்து', 'பத்து', 'டென'],
|
16 |
+
|
17 |
+
# Numbers from 11 to 19
|
18 |
+
'eleven': ['பதினொன்று', 'பதினொன்னு', 'எலெவன்'],
|
19 |
+
'twelve': ['பன்னிரண்டு', 'பன்னிரண்டு', 'ட்வெ���்வ்'],
|
20 |
+
'thirteen': ['பதின்மூன்று', 'பதின்முன்னு', 'தர்டீன்'],
|
21 |
+
'fourteen': ['பதினான்கு', 'பதின்நாலு', 'ஃபோர்டீன்'],
|
22 |
+
'fifteen': ['பதினைந்து', 'பதினஞ்சு', 'ஃபிப்டீன்'],
|
23 |
+
'sixteen': ['பதினாறு', 'பதினாறோ', 'சிக்ஸ்டீன்'],
|
24 |
+
'seventeen': ['பதினேழு', 'பதினேழு', 'செவன்டீன்'],
|
25 |
+
'eighteen': ['பதினெட்டு', 'பதினெட்டு', 'ஏட்டீன்'],
|
26 |
+
'nineteen': ['பத்தொன்பது', 'பத்தொம்பது', 'நைன்டீன்'],
|
27 |
+
|
28 |
+
# Multiples of ten
|
29 |
+
'twenty': ['இருபது', 'இருபத்து', 'ட்வென்டி'],
|
30 |
+
'thirty': ['முப்பது', 'முப்பத்து', 'தர்டி'],
|
31 |
+
'forty': ['நாற்பது', 'நாற்பத்து', 'ஃபோர்டி'],
|
32 |
+
'fifty': ['ஐம்பது', 'ஐம்பத்து', 'ஃபிப்டி'],
|
33 |
+
'sixty': ['அறுபது', 'அறுபத்து', 'சிக்ஸ்டி'],
|
34 |
+
'seventy': ['எழுபது', 'எழுபத்து', 'செவன்டி'],
|
35 |
+
'eighty': ['எண்பது', 'எண்பத்து', 'ஏட்டி'],
|
36 |
+
'ninety': ['தொண்ணூறு', 'தொன்னூறு', 'நைன்டி'],
|
37 |
+
|
38 |
+
# Numbers from 21 to 29
|
39 |
+
'twenty one': ['இருபத்து ஒன்று', 'இருபத்தொன்று', 'ட்வென்டி ஒன்'],
|
40 |
+
'twenty two': ['இருபத்து இரண்டு', 'இருபத்திரண்டு', 'ட்வென்டி டூ'],
|
41 |
+
'twenty three': ['இருபத்து மூன்று', 'இருபத்துமூன்று', 'ட்வென்டி த்ரீ'],
|
42 |
+
'twenty four': ['இருபத்து நான்கு', 'இருபத்துநான்கு', 'ட்வென்டி ஃபோர்'],
|
43 |
+
'twenty five': ['இருபத்து ஐந்து', 'இருபத்துஐந்து', 'ட்வென்டி ஃபைவ்'],
|
44 |
+
'twenty six': ['இருபத்து ஆறு', 'இருபத்துஆறு', 'ட்வென்டி சிக்ஸ்'],
|
45 |
+
'twenty seven': ['இருபத்து ஏழு', 'இருபத்துஏழு', 'ட்வென்டி செவன்'],
|
46 |
+
'twenty eight': ['இருபத்து எட்டு', 'இருபத்துஎட்டு', 'ட்வென்டி ஏட்'],
|
47 |
+
'twenty nine': ['இருபத்து ஒன்பது', 'இருபத்தொன்பது', 'ட்வென்டி நைன்'],
|
48 |
+
|
49 |
+
# Numbers from 31 to 39
|
50 |
+
'thirty one': ['முப்பத்து ஒன்று', 'முப்பத்தொன்று', 'தர்டி ஒன்'],
|
51 |
+
'thirty two': ['முப்பத்து இரண்டு', 'முப்பத்திரண்டு', 'தர்டி டூ'],
|
52 |
+
'thirty three': ['முப்பத்து மூன்று', 'முப்பத்துமூன்று', 'தர்டி த்ரீ'],
|
53 |
+
'thirty four': ['முப்பத்து நான்கு', 'முப்பத்துநான்கு', 'தர்டி ஃபோர்'],
|
54 |
+
'thirty five': ['முப்பத்து ஐந்து', 'முப்பத்துஐந்து', 'தர்டி ஃபைவ்'],
|
55 |
+
'thirty six': ['முப்பத்து ஆறு', 'முப்பத்துஆறு', 'தர்டி சிக்ஸ்'],
|
56 |
+
'thirty seven': ['முப்பத்து ஏழு', 'முப்பத்துஏழு', 'தர்டி செவன்'],
|
57 |
+
'thirty eight': ['முப்பத்து எட்டு', 'முப்பத்துஎட்டு', 'தர்டி ஏட்'],
|
58 |
+
'thirty nine': ['முப்பத்து ஒன்பது', 'முப்பத்தொன்பது', 'தர்டி நைன்'],
|
59 |
+
|
60 |
+
# Numbers from 41 to 49
|
61 |
+
'forty one': ['நாற்பத்து ஒன்று', 'நாற்பத்தொன்று', 'ஃபோர்டி ஒன்'],
|
62 |
+
'forty two': ['நாற்பத்து இரண்டு', 'நாற்பத்திரண்டு', 'ஃபோர்டி டூ'],
|
63 |
+
'forty three': ['நாற்பத்து மூன்று', 'நாற்பத்துமூன்று', 'ஃபோர்டி த்ரீ'],
|
64 |
+
'forty four': ['நாற்பத்து நான்கு', 'நாற்பத்துநான்கு', 'ஃபோர்டி ஃபோர்'],
|
65 |
+
'forty five': ['நாற்பத்து ஐந்து', 'நாற்பத்துஐந்து', 'ஃபோர்டி ஃபைவ்'],
|
66 |
+
'forty six': ['நாற்பத்து ஆ���ு', 'நாற்பத்துஆறு', 'ஃபோர்டி சிக்ஸ்'],
|
67 |
+
'forty seven': ['நாற்பத்து ஏழு', 'நாற்பத்துஏழு', 'ஃபோர்டி செவன்'],
|
68 |
+
'forty eight': ['நாற்பத்து எட்டு', 'நாற்பத்துஎட்டு', 'ஃபோர்டி ஏட்'],
|
69 |
+
'forty nine': ['நாற்பத்து ஒன்பது', 'நாற்பத்தொன்பது', 'ஃபோர்டி நைன்'],
|
70 |
+
|
71 |
+
# Numbers from 51 to 59
|
72 |
+
'fifty one': ['ஐம்பத்து ஒன்று', 'ஐம்பத்தொன்று', 'ஃபிப்டி ஒன்'],
|
73 |
+
'fifty two': ['ஐம்பத்து இரண்டு', 'ஐம்பத்திரண்டு', 'ஃபிப்டி டூ'],
|
74 |
+
'fifty three': ['ஐம்பத்து மூன்று', 'ஐம்பத்துமூன்று', 'ஃபிப்டி த்ரீ'],
|
75 |
+
'fifty four': ['ஐம்பத்து நான்கு', 'ஐம்பத்துநான்கு', 'ஃபிப்டி ஃபோர்'],
|
76 |
+
'fifty five': ['ஐம்பத்து ஐந்து', 'ஐம்பத்துஐந்து', 'ஃபிப்டி ஃபைவ்'],
|
77 |
+
'fifty six': ['ஐம்பத்து ஆறு', 'ஐம்பத்துஆறு', 'ஃபிப்டி சிக்ஸ்'],
|
78 |
+
'fifty seven': ['ஐம்பத்து ஏழு', 'ஐம்பத்துஏழு', 'ஃபிப்டி செவன்'],
|
79 |
+
'fifty eight': ['ஐம்பத்து எட்டு', 'ஐம்பத்துஎட்டு', 'ஃபிப்டி ஏட்'],
|
80 |
+
'fifty nine': ['ஐம்பத்து ஒன்பது', 'ஐம்பத்தொன்பது', 'ஃபிப்டி நைன்'],
|
81 |
+
|
82 |
+
# Numbers from 61 to 69
|
83 |
+
'sixty one': ['அறுபத்து ஒன்று', 'அறுபத்தொன்று', 'சிக்ஸ்டி ஒன்'],
|
84 |
+
'sixty two': ['அறுபத்து இரண்டு', 'அறுபத்திரண்டு', 'சிக்ஸ்டி டூ'],
|
85 |
+
'sixty three': ['அறுபத்து மூன்று', 'அறுபத்துமூன்று', 'சிக்ஸ்டி த்ரீ'],
|
86 |
+
'sixty four': ['அறுபத்து நான்கு', 'அறுபத்துநான்கு', 'சிக்ஸ்டி ஃபோர்'],
|
87 |
+
'sixty five': ['அறுபத்து ஐந்து', 'அறுபத்துஐந்து', 'சிக்ஸ்டி ஃபைவ்'],
|
88 |
+
'sixty six': ['அறுபத்து ஆறு', 'அறுபத்துஆறு', 'சிக்ஸ்டி சிக்ஸ்'],
|
89 |
+
'sixty seven': ['அறுபத்து ஏழு', 'அறுபத்துஏழு', 'சிக்ஸ்டி செவன்'],
|
90 |
+
'sixty eight': ['அறுபத்து எட்டு', 'அறுபத்துஎட்டு', 'சிக்ஸ்டி ஏட்'],
|
91 |
+
'sixty nine': ['அறுபத்து ஒன்பது', 'அறுபத்தொன்பது', 'சிக்ஸ்டி நைன்'],
|
92 |
+
|
93 |
+
# Numbers from 71 to 79
|
94 |
+
'seventy one': ['எழுபத்து ஒன்று', 'எழுபத்தொன்று', 'செவன்டி ஒன்'],
|
95 |
+
'seventy two': ['எழுபத்து இரண்டு', 'எழுபத்திரண்டு', 'செவன்டி டூ'],
|
96 |
+
'seventy three': ['எழுபத்து மூன்று', 'எழுபத்துமூன்று', 'செவன்டி த்ரீ'],
|
97 |
+
'seventy four': ['எழுபத்து நான்கு', 'எழுபத்துநான்கு', 'செவன்டி ஃபோர்'],
|
98 |
+
'seventy five': ['எழுபத்து ஐந்து', 'எழுபத்துஐந்து', 'செவன்டி ஃபைவ்'],
|
99 |
+
'seventy six': ['எழுபத்து ஆறு', 'எழுபத்துஆறு', 'செவன்டி சிக்ஸ்'],
|
100 |
+
'seventy seven': ['எழுபத்து ஏழு', 'எழுபத்துஏழு', 'செவன்டி செவன்'],
|
101 |
+
'seventy eight': ['எழுபத்து எட்டு', 'எழுபத்துஎட்டு', 'செவன்டி ஏட்'],
|
102 |
+
'seventy nine': ['எழுபத்து ஒன்பது', 'எழுபத்தொன்பது', 'செவன்டி நைன்'],
|
103 |
+
|
104 |
+
# Numbers from 81 to 89
|
105 |
+
'eighty one': ['எண்பத்து ஒன்று', 'எண்பத்தொன்று', 'ஏட்டி ஒன்'],
|
106 |
+
'eighty two': ['எண்பத்து இரண்டு', 'எண்பத்திரண்டு', 'ஏட்டி டூ'],
|
107 |
+
'eighty three': ['எண்பத்து மூன்று', 'எண்பத்துமூன்று', 'ஏட்டி த்ரீ'],
|
108 |
+
'eighty four': ['எண்பத்து நான��கு', 'எண்பத்துநான்கு', 'ஏட்டி ஃபோர்'],
|
109 |
+
'eighty five': ['எண்பத்து ஐந்து', 'எண்பத்துஐந்து', 'ஏட்டி ஃபைவ்'],
|
110 |
+
'eighty six': ['எண்பத்து ஆறு', 'எண்பத்துஆறு', 'ஏட்டி சிக்ஸ்'],
|
111 |
+
'eighty seven': ['எண்பத்து ஏழு', 'எண்பத்துஏழு', 'ஏட்டி செவன்'],
|
112 |
+
'eighty eight': ['எண்பத்து எட்டு', 'எண்பத்துஎட்டு', 'ஏட்டி ஏட்'],
|
113 |
+
'eighty nine': ['எண்பத்து ஒன்பது', 'எண்பத்தொன்பது', 'ஏட்டி நைன்'],
|
114 |
+
|
115 |
+
# Numbers from 91 to 99
|
116 |
+
'ninety one': ['தொண்ணூற்று ஒன்று', 'தொண்ணூற்றொன்று', 'நைன்டி ஒன்'],
|
117 |
+
'ninety two': ['தொண்ணூற்று இரண்டு', 'தொண்ணூற்றிரண்டு', 'நைன்டி டூ'],
|
118 |
+
'ninety three': ['தொண்ணூற்று மூன்று', 'தொண்ணூற்றுமூன்று', 'நைன்டி த்ரீ'],
|
119 |
+
'ninety four': ['தொண்ணூற்று நான்கு', 'தொண்ணூற்றுநான்கு', 'நைன்டி ஃபோர்'],
|
120 |
+
'ninety five': ['தொண்ணூற்று ஐந்து', 'தொண்ணூற்றுஐந்து', 'நைன்டி ஃபைவ்'],
|
121 |
+
'ninety six': ['தொண்ணூற்று ஆறு', 'தொண்ணூற்றுஆறு', 'நைன்டி சிக்ஸ்'],
|
122 |
+
'ninety seven': ['தொண்ணூற்று ஏழு', 'தொண்ணூற்றுஏழு', 'நைன்டி செவன்'],
|
123 |
+
'ninety eight': ['தொண்ணூற்று எட்டு', 'தொண்ணூற்றுஎட்டு', 'நைன்டி ஏட்'],
|
124 |
+
'ninety nine': ['தொண்ணூற்று ஒன்பது', 'தொண்ணூற்றொன்பது', 'நைன்டி நைன்'],
|
125 |
+
|
126 |
+
# Hundred
|
127 |
+
'hundred': ['நூறு', 'நூறை', 'ஹண்ட்ரெட்'],
|
128 |
+
# Thousand
|
129 |
+
'thousand': ['ஆயிரம்'],
|
130 |
+
}
|
131 |
+
|
132 |
+
words = sentence.split() # Split the sentence by spaces
|
133 |
+
|
134 |
+
# Replace words using the mapping
|
135 |
+
for i, word in enumerate(words):
|
136 |
+
for replacement, patterns in replacement_map.items():
|
137 |
+
if word in patterns:
|
138 |
+
words[i] = replacement # Replace the word if it's fully matched
|
139 |
+
|
140 |
+
# Join the processed words back into a sentence
|
141 |
+
return ' '.join(words)
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|