Spaces:
Sleeping
Sleeping
Delete replaceWords.ipynb
Browse files- replaceWords.ipynb +0 -182
replaceWords.ipynb
DELETED
@@ -1,182 +0,0 @@
|
|
1 |
-
{
|
2 |
-
"cells": [
|
3 |
-
{
|
4 |
-
"cell_type": "code",
|
5 |
-
"execution_count": 9,
|
6 |
-
"id": "19bbb494-3054-48ae-9b64-7f0756c0532d",
|
7 |
-
"metadata": {},
|
8 |
-
"outputs": [],
|
9 |
-
"source": [
|
10 |
-
"import re\n",
|
11 |
-
"def replace_words(sentence):\n",
|
12 |
-
" replacement_map = {\n",
|
13 |
-
" # Single digits\n",
|
14 |
-
" 'one': ['ஒன்று', 'ஒன்னு', 'ஒன்'],\n",
|
15 |
-
" 'two': ['இரண்டு', 'ரெண்டு', 'டூ'],\n",
|
16 |
-
" 'three': ['மூன்று', 'முன்னு', 'த்ரீ'],\n",
|
17 |
-
" 'four': ['நான்கு', 'நாலு', 'ஃபோர்'],\n",
|
18 |
-
" 'five': ['ஐந்து', 'அஞ்சு', 'ஃபைவ்'],\n",
|
19 |
-
" 'six': ['ஆறு', 'ஆறு', 'சிக்ஸ்'],\n",
|
20 |
-
" 'seven': ['ஏழு', 'எழு', 'செவன்'],\n",
|
21 |
-
" 'eight': ['எட்டு', 'எட்டு', 'எய்ட்'],\n",
|
22 |
-
" 'nine': ['ஒன்பது', 'ஒம்பது', 'நைன்'],\n",
|
23 |
-
" 'ten': ['பத்து', 'பத்து', 'டென'],\n",
|
24 |
-
"\n",
|
25 |
-
" # Numbers from 11 to 19\n",
|
26 |
-
" 'eleven': ['பதினொன்று', 'பதினொன்னு', 'எலெவன்'],\n",
|
27 |
-
" 'twelve': ['பன்னிரண்டு', 'பன்னிரண்டு', 'ட்வெல்வ்'],\n",
|
28 |
-
" 'thirteen': ['பதின்மூன்று', 'பதின்முன்னு', 'தர்டீன்'],\n",
|
29 |
-
" 'fourteen': ['பதினான்கு', 'பதின்நாலு', 'ஃபோர்டீன்'],\n",
|
30 |
-
" 'fifteen': ['பதினைந்து', 'பதினஞ்சு', 'ஃபிப்டீன்'],\n",
|
31 |
-
" 'sixteen': ['பதினாறு', 'பதினாறோ', 'சிக்ஸ்டீன்'],\n",
|
32 |
-
" 'seventeen': ['பதினேழு', 'பதினேழு', 'செவன்டீன்'],\n",
|
33 |
-
" 'eighteen': ['பதினெட்டு', 'பதினெட்டு', 'ஏட்டீன்'],\n",
|
34 |
-
" 'nineteen': ['பத்தொன்பது', 'பத்தொம்பது', 'நைன்டீன்'],\n",
|
35 |
-
"\n",
|
36 |
-
" # Multiples of ten\n",
|
37 |
-
" 'twenty': ['இருபது', 'இருபத்து', 'ட்வென்டி'],\n",
|
38 |
-
" 'thirty': ['முப்பது', 'முப்பத்து', 'தர்டி'],\n",
|
39 |
-
" 'forty': ['நாற்பது', 'நாற்பத்து', 'ஃபோர்டி'],\n",
|
40 |
-
" 'fifty': ['ஐம்பது', 'ஐம்பத்து', 'ஃபிப்டி'],\n",
|
41 |
-
" 'sixty': ['அறுபது', 'அறுபத்து', 'சிக்ஸ்டி'],\n",
|
42 |
-
" 'seventy': ['எழுபது', 'எழுபத்து', 'செவன்டி'],\n",
|
43 |
-
" 'eighty': ['எண்பது', 'எண்பத்து', 'ஏட்டி'],\n",
|
44 |
-
" 'ninety': ['தொண்ணூறு', 'தொன்னூறு', 'நைன்டி'],\n",
|
45 |
-
"\n",
|
46 |
-
" # Numbers from 21 to 29\n",
|
47 |
-
" 'twenty one': ['இருபத்து ஒன்று', 'இருபத்தொன்று', 'ட்வென்டி ஒன்'],\n",
|
48 |
-
" 'twenty two': ['இருபத்து இரண்டு', 'இருபத்திரண்டு', 'ட்வென்டி டூ'],\n",
|
49 |
-
" 'twenty three': ['இருபத்து மூன்று', 'இருபத்துமூன்று', 'ட்வென்டி த்ரீ'],\n",
|
50 |
-
" 'twenty four': ['இருபத்து நான்கு', 'இருபத்துநான்கு', 'ட்வென்டி ஃபோர்'],\n",
|
51 |
-
" 'twenty five': ['இருபத்து ஐந்து', 'இருபத்துஐந்து', 'ட்வென்டி ஃபைவ்'],\n",
|
52 |
-
" 'twenty six': ['இருபத்து ஆறு', 'இருபத்துஆறு', 'ட்வென்டி சிக்ஸ்'],\n",
|
53 |
-
" 'twenty seven': ['இருபத்து ஏழு', 'இருபத்துஏழு', 'ட்வென்டி செவன்'],\n",
|
54 |
-
" 'twenty eight': ['இருபத்து எட்டு', 'இருபத்துஎட்டு', 'ட்வென்டி ஏட்'],\n",
|
55 |
-
" 'twenty nine': ['இருபத்து ஒன்பது', 'இருபத்தொன்பது', 'ட்வென்டி நைன்'],\n",
|
56 |
-
"\n",
|
57 |
-
" # Numbers from 31 to 39\n",
|
58 |
-
" 'thirty one': ['முப்பத்து ஒன்று', 'முப்பத்தொன்று', 'தர்டி ஒன்'],\n",
|
59 |
-
" 'thirty two': ['முப்பத்து இரண்டு', 'முப்பத்திரண்டு', 'தர்டி டூ'],\n",
|
60 |
-
" 'thirty three': ['முப்பத்து மூன்று', 'முப்பத்துமூன்று', 'தர்டி த்ரீ'],\n",
|
61 |
-
" 'thirty four': ['முப்பத்து நான்க���', 'முப்பத்துநான்கு', 'தர்டி ஃபோர்'],\n",
|
62 |
-
" 'thirty five': ['முப்பத்து ஐந்து', 'முப்பத்துஐந்து', 'தர்டி ஃபைவ்'],\n",
|
63 |
-
" 'thirty six': ['முப்பத்து ஆறு', 'முப்பத்துஆறு', 'தர்டி சிக்ஸ்'],\n",
|
64 |
-
" 'thirty seven': ['முப்பத்து ஏழு', 'முப்பத்துஏழு', 'தர்டி செவன்'],\n",
|
65 |
-
" 'thirty eight': ['முப்பத்து எட்டு', 'முப்பத்துஎட்டு', 'தர்டி ஏட்'],\n",
|
66 |
-
" 'thirty nine': ['முப்பத்து ஒன்பது', 'முப்பத்தொன்பது', 'தர்டி நைன்'],\n",
|
67 |
-
"\n",
|
68 |
-
" # Numbers from 41 to 49\n",
|
69 |
-
" 'forty one': ['நாற்பத்து ஒன்று', 'நாற்பத்தொன்று', 'ஃபோர்டி ஒன்'],\n",
|
70 |
-
" 'forty two': ['நாற்பத்து இரண்டு', 'நாற்பத்திரண்டு', 'ஃபோர்டி டூ'],\n",
|
71 |
-
" 'forty three': ['நாற்பத்து மூன்று', 'நாற்பத்துமூன்று', 'ஃபோர்டி த்ரீ'],\n",
|
72 |
-
" 'forty four': ['நாற்பத்து நான்கு', 'நாற்பத்துநான்கு', 'ஃபோர்டி ஃபோர்'],\n",
|
73 |
-
" 'forty five': ['நாற்பத்து ஐந்து', 'நாற்பத்துஐந்து', 'ஃபோர்டி ஃபைவ்'],\n",
|
74 |
-
" 'forty six': ['நாற்பத்து ஆறு', 'நாற்பத்துஆறு', 'ஃபோர்டி சிக்ஸ்'],\n",
|
75 |
-
" 'forty seven': ['நாற்பத்து ஏழு', 'நாற்பத்துஏழு', 'ஃபோர்டி செவன்'],\n",
|
76 |
-
" 'forty eight': ['நாற்பத்து எட்டு', 'நாற்பத்துஎட்டு', 'ஃபோர்டி ஏட்'],\n",
|
77 |
-
" 'forty nine': ['நாற்பத்து ஒன்பது', 'நாற்பத்தொன்பது', 'ஃபோர்டி நைன்'],\n",
|
78 |
-
"\n",
|
79 |
-
" # Numbers from 51 to 59\n",
|
80 |
-
" 'fifty one': ['ஐம்பத்து ஒன்று', 'ஐம்பத்தொன்று', 'ஃபிப்டி ஒன்'],\n",
|
81 |
-
" 'fifty two': ['ஐம்பத்து இரண்டு', 'ஐம்பத்திரண்டு', 'ஃபிப்டி டூ'],\n",
|
82 |
-
" 'fifty three': ['ஐம்பத்து மூன்று', 'ஐம்பத்துமூன்று', 'ஃபிப்டி த்ரீ'],\n",
|
83 |
-
" 'fifty four': ['ஐம்பத்து நான்கு', 'ஐம்பத்துநான்கு', 'ஃபிப்டி ஃபோர்'],\n",
|
84 |
-
" 'fifty five': ['ஐம்பத்து ஐந்து', 'ஐம்பத்துஐந்து', 'ஃபிப்டி ஃபைவ்'],\n",
|
85 |
-
" 'fifty six': ['ஐம்பத்து ஆறு', 'ஐம்பத்துஆறு', 'ஃபிப்டி சிக்ஸ்'],\n",
|
86 |
-
" 'fifty seven': ['ஐம்பத்து ஏழு', 'ஐம்பத்துஏழு', 'ஃபிப்டி செவன்'],\n",
|
87 |
-
" 'fifty eight': ['ஐம்பத்து எட்டு', 'ஐம்பத்துஎட்டு', 'ஃபிப்டி ஏட்'],\n",
|
88 |
-
" 'fifty nine': ['ஐம்பத்து ஒன்பது', 'ஐம்பத்தொன்பது', 'ஃபிப்டி நைன்'],\n",
|
89 |
-
" \n",
|
90 |
-
" # Numbers from 61 to 69\n",
|
91 |
-
" 'sixty one': ['அறுபத்து ஒன்று', 'அறுபத்தொன்று', 'சிக்ஸ்டி ஒன்'],\n",
|
92 |
-
" 'sixty two': ['அறுபத்து இரண்டு', 'அறுபத்திரண்டு', 'சிக்ஸ்டி டூ'],\n",
|
93 |
-
" 'sixty three': ['அறுபத்து மூன்று', 'அறுபத்துமூன்று', 'சிக்ஸ்டி த்ரீ'],\n",
|
94 |
-
" 'sixty four': ['அறுபத்து நான்கு', 'அறுபத்துநான்கு', 'சிக்ஸ்டி ஃபோர்'],\n",
|
95 |
-
" 'sixty five': ['அறுபத்து ஐந்து', 'அறுபத்துஐந்து', 'சிக்ஸ்டி ஃபைவ்'],\n",
|
96 |
-
" 'sixty six': ['அறுபத்து ஆறு', 'அறுபத்துஆறு', 'சிக்ஸ்டி சிக்ஸ்'],\n",
|
97 |
-
" 'sixty seven': ['அறுபத்து ஏழு', 'அறுபத்துஏழு', 'சிக்ஸ்டி செவன்'],\n",
|
98 |
-
" 'sixty eight': ['அறுபத்து எட்டு', 'அறுபத்துஎட்டு', 'சிக்ஸ்டி ஏட்'],\n",
|
99 |
-
" 'sixty nine': ['அறுபத்து ஒன்பது', 'அறுபத்தொன்பது', 'சிக்ஸ்டி நைன்'],\n",
|
100 |
-
"\n",
|
101 |
-
" # Numbers from 71 to 79\n",
|
102 |
-
" 'seventy one': ['எழுபத்து ஒன்று', 'எழுபத்தொன்று', 'செவன்டி ஒன்'],\n",
|
103 |
-
" 'seventy two': ['எழுபத்து இரண்டு', 'எழுபத்திரண்டு', 'செவன்டி டூ'],\n",
|
104 |
-
" 'seventy three': ['எழுபத்து மூன்று', 'எழுபத்துமூன்று', 'செவன்டி த்ரீ'],\n",
|
105 |
-
" 'seventy four': ['எழுபத்து நான்கு', 'எழுபத்துநான்கு', 'செவன்டி ஃபோர்'],\n",
|
106 |
-
" 'seventy five': ['எழுபத்து ஐந்து', 'எழுபத்துஐந்து', 'செவன்டி ஃபைவ்'],\n",
|
107 |
-
" 'seventy six': ['எழுபத்து ஆறு', 'எழுபத்துஆறு', 'செவன்டி சிக்ஸ்'],\n",
|
108 |
-
" 'seventy seven': ['எழுபத்து ஏழு', 'எழுபத்துஏழு', 'செவன்டி செவன்'],\n",
|
109 |
-
" 'seventy eight': ['எழுபத்து எட்டு', 'எழுபத்துஎட்டு', 'செவன்டி ஏட்'],\n",
|
110 |
-
" 'seventy nine': ['எழுபத்து ஒன்பது', 'எழுபத்தொன்பது', 'செவன்டி நைன்'],\n",
|
111 |
-
"\n",
|
112 |
-
" # Numbers from 81 to 89\n",
|
113 |
-
" 'eighty one': ['எண்பத்து ஒன்று', 'எண்பத்தொன்று', 'ஏட்டி ஒன்'],\n",
|
114 |
-
" 'eighty two': ['எண்பத்து இரண்டு', 'எண்பத்திரண்டு', 'ஏட்டி டூ'],\n",
|
115 |
-
" 'eighty three': ['எண்பத்து மூன்று', 'எண்பத்துமூன்று', 'ஏட்டி த்ரீ'],\n",
|
116 |
-
" 'eighty four': ['எண்பத்து நான்கு', 'எண்பத்துநான்கு', 'ஏட்டி ஃபோர்'],\n",
|
117 |
-
" 'eighty five': ['எண்பத்து ஐந்து', 'எண்பத்துஐந்து', 'ஏட்டி ஃபைவ்'],\n",
|
118 |
-
" 'eighty six': ['எண்பத்து ஆறு', 'எண்பத்துஆறு', 'ஏட்டி சிக்ஸ்'],\n",
|
119 |
-
" 'eighty seven': ['எண்பத்து ஏழு', 'எண்பத்துஏழு', 'ஏட்டி செவன்'],\n",
|
120 |
-
" 'eighty eight': ['எண்பத்து எட்டு', 'எண்பத்துஎட்டு', 'ஏட்டி ஏட்'],\n",
|
121 |
-
" 'eighty nine': ['எண்பத்து ஒன்பது', 'எண்பத்தொன்பது', 'ஏட்டி நைன்'],\n",
|
122 |
-
"\n",
|
123 |
-
" # Numbers from 91 to 99\n",
|
124 |
-
" 'ninety one': ['தொண்ணூற்று ஒன்று', 'தொண்ணூற்றொன்று', 'நைன்டி ஒன்'],\n",
|
125 |
-
" 'ninety two': ['தொண்ணூற்று இரண்டு', 'தொண்ணூற்றிரண்டு', 'நைன்டி டூ'],\n",
|
126 |
-
" 'ninety three': ['தொண்ணூற்று மூன்று', 'தொண்ணூற்றுமூன்று', 'நைன்டி த்ரீ'],\n",
|
127 |
-
" 'ninety four': ['தொண்ணூற்று நான்கு', 'தொண்ணூற்றுநான்கு', 'நைன்டி ஃபோர்'],\n",
|
128 |
-
" 'ninety five': ['தொண்ணூற்று ஐந்து', 'தொண்ணூற்றுஐந்து', 'நைன்டி ஃபைவ்'],\n",
|
129 |
-
" 'ninety six': ['தொண்ணூற்று ஆறு', 'தொண்ணூற்றுஆறு', 'நைன்டி சிக்ஸ்'],\n",
|
130 |
-
" 'ninety seven': ['தொண்ணூற்று ஏழு', 'தொண்ணூற்றுஏழு', 'நைன்டி செவன்'],\n",
|
131 |
-
" 'ninety eight': ['தொண்ணூற்று எட்டு', 'தொண்ணூற்றுஎட்டு', 'நைன்டி ஏட்'],\n",
|
132 |
-
" 'ninety nine': ['தொண்ணூற்று ஒன்பது', 'தொண்ணூற்றொன்பது', 'நைன்டி நைன்'],\n",
|
133 |
-
"\n",
|
134 |
-
" # Hundred\n",
|
135 |
-
" 'hundred': ['நூறு', 'நூறை', 'ஹண்ட்ரெட்'],\n",
|
136 |
-
" # Thousand\n",
|
137 |
-
" 'thousand': ['ஆயிரம்'],\n",
|
138 |
-
" }\n",
|
139 |
-
" \n",
|
140 |
-
" words = sentence.split() # Split the sentence by spaces\n",
|
141 |
-
" \n",
|
142 |
-
" # Replace words using the mapping\n",
|
143 |
-
" for i, word in enumerate(words):\n",
|
144 |
-
" for replacement, patterns in replacement_map.items():\n",
|
145 |
-
" if word in patterns:\n",
|
146 |
-
" words[i] = replacement # Replace the word if it's fully matched\n",
|
147 |
-
" \n",
|
148 |
-
" # Join the processed words back into a sentence\n",
|
149 |
-
" return ' '.join(words)"
|
150 |
-
]
|
151 |
-
},
|
152 |
-
{
|
153 |
-
"cell_type": "code",
|
154 |
-
"execution_count": null,
|
155 |
-
"id": "7bdb593a-cb68-4b04-af8d-b61ea396a5eb",
|
156 |
-
"metadata": {},
|
157 |
-
"outputs": [],
|
158 |
-
"source": []
|
159 |
-
}
|
160 |
-
],
|
161 |
-
"metadata": {
|
162 |
-
"kernelspec": {
|
163 |
-
"display_name": "Python 3 (ipykernel)",
|
164 |
-
"language": "python",
|
165 |
-
"name": "python3"
|
166 |
-
},
|
167 |
-
"language_info": {
|
168 |
-
"codemirror_mode": {
|
169 |
-
"name": "ipython",
|
170 |
-
"version": 3
|
171 |
-
},
|
172 |
-
"file_extension": ".py",
|
173 |
-
"mimetype": "text/x-python",
|
174 |
-
"name": "python",
|
175 |
-
"nbconvert_exporter": "python",
|
176 |
-
"pygments_lexer": "ipython3",
|
177 |
-
"version": "3.11.7"
|
178 |
-
}
|
179 |
-
},
|
180 |
-
"nbformat": 4,
|
181 |
-
"nbformat_minor": 5
|
182 |
-
}
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|