cdactvm commited on
Commit
f49c883
·
verified ·
1 Parent(s): 46b307b

Delete replaceWords.ipynb

Browse files
Files changed (1) hide show
  1. replaceWords.ipynb +0 -182
replaceWords.ipynb DELETED
@@ -1,182 +0,0 @@
1
- {
2
- "cells": [
3
- {
4
- "cell_type": "code",
5
- "execution_count": 9,
6
- "id": "19bbb494-3054-48ae-9b64-7f0756c0532d",
7
- "metadata": {},
8
- "outputs": [],
9
- "source": [
10
- "import re\n",
11
- "def replace_words(sentence):\n",
12
- " replacement_map = {\n",
13
- " # Single digits\n",
14
- " 'one': ['ஒன்று', 'ஒன்னு', 'ஒன்'],\n",
15
- " 'two': ['இரண்டு', 'ரெண்டு', 'டூ'],\n",
16
- " 'three': ['மூன்று', 'முன்னு', 'த்ரீ'],\n",
17
- " 'four': ['நான்கு', 'நாலு', 'ஃபோர்'],\n",
18
- " 'five': ['ஐந்து', 'அஞ்சு', 'ஃபைவ்'],\n",
19
- " 'six': ['ஆறு', 'ஆறு', 'சிக்ஸ்'],\n",
20
- " 'seven': ['ஏழு', 'எழு', 'செவன்'],\n",
21
- " 'eight': ['எட்டு', 'எட்டு', 'எய்ட்'],\n",
22
- " 'nine': ['ஒன்பது', 'ஒம்பது', 'நைன்'],\n",
23
- " 'ten': ['பத்து', 'பத்து', 'டென'],\n",
24
- "\n",
25
- " # Numbers from 11 to 19\n",
26
- " 'eleven': ['பதினொன்று', 'பதினொன்னு', 'எலெவன்'],\n",
27
- " 'twelve': ['பன்னிரண்டு', 'பன்னிரண்டு', 'ட்வெல்வ்'],\n",
28
- " 'thirteen': ['பதின்மூன்று', 'பதின்முன்னு', 'தர்டீன்'],\n",
29
- " 'fourteen': ['பதினான்கு', 'பதின்நாலு', 'ஃபோர்டீன்'],\n",
30
- " 'fifteen': ['பதினைந்து', 'பதினஞ்சு', 'ஃபிப்டீன்'],\n",
31
- " 'sixteen': ['பதினாறு', 'பதினாறோ', 'சிக்ஸ்டீன்'],\n",
32
- " 'seventeen': ['பதினேழு', 'பதினேழு', 'செவன்டீன்'],\n",
33
- " 'eighteen': ['பதினெட்டு', 'பதினெட்டு', 'ஏட்டீன்'],\n",
34
- " 'nineteen': ['பத்தொன்பது', 'பத்தொம்பது', 'நைன்டீன்'],\n",
35
- "\n",
36
- " # Multiples of ten\n",
37
- " 'twenty': ['இருபது', 'இருபத்து', 'ட்வென்டி'],\n",
38
- " 'thirty': ['முப்பது', 'முப்பத்து', 'தர்டி'],\n",
39
- " 'forty': ['நாற்பது', 'நாற்பத்து', 'ஃபோர்டி'],\n",
40
- " 'fifty': ['ஐம்பது', 'ஐம்பத்து', 'ஃபிப்டி'],\n",
41
- " 'sixty': ['அறுபது', 'அறுபத்து', 'சிக்ஸ்டி'],\n",
42
- " 'seventy': ['எழுபது', 'எழுபத்து', 'செவன்டி'],\n",
43
- " 'eighty': ['எண்பது', 'எண்பத்து', 'ஏட்டி'],\n",
44
- " 'ninety': ['தொண்ணூறு', 'தொன்னூறு', 'நைன்டி'],\n",
45
- "\n",
46
- " # Numbers from 21 to 29\n",
47
- " 'twenty one': ['இருபத்து ஒன்று', 'இருபத்தொன்று', 'ட்வென்டி ஒன்'],\n",
48
- " 'twenty two': ['இருபத்து இரண்டு', 'இருபத்திரண்டு', 'ட்வென்டி டூ'],\n",
49
- " 'twenty three': ['இருபத்து மூன்று', 'இருபத்துமூன்று', 'ட்வென்டி த்ரீ'],\n",
50
- " 'twenty four': ['இருபத்து நான்கு', 'இருபத்துநான்கு', 'ட்வென்டி ஃபோர்'],\n",
51
- " 'twenty five': ['இருபத்து ஐந்து', 'இருபத்துஐந்து', 'ட்வென்டி ஃபைவ்'],\n",
52
- " 'twenty six': ['இருபத்து ஆறு', 'இருபத்துஆறு', 'ட்வென்டி சிக்ஸ்'],\n",
53
- " 'twenty seven': ['இருபத்து ஏழு', 'இருபத்துஏழு', 'ட்வென்டி செவன்'],\n",
54
- " 'twenty eight': ['இருபத்து எட்டு', 'இருபத்துஎட்டு', 'ட்வென்டி ஏட்'],\n",
55
- " 'twenty nine': ['இருபத்து ஒன்பது', 'இருபத்தொன்பது', 'ட்வென்டி நைன்'],\n",
56
- "\n",
57
- " # Numbers from 31 to 39\n",
58
- " 'thirty one': ['முப்பத்து ஒன்று', 'முப்பத்தொன்று', 'தர்டி ஒன்'],\n",
59
- " 'thirty two': ['முப்பத்து இரண்டு', 'முப்பத்திரண்டு', 'தர்டி டூ'],\n",
60
- " 'thirty three': ['முப்பத்து மூன்று', 'முப்பத்துமூன்று', 'தர்டி த்ரீ'],\n",
61
- " 'thirty four': ['முப்பத்து நான்க���', 'முப்பத்துநான்கு', 'தர்டி ஃபோர்'],\n",
62
- " 'thirty five': ['முப்பத்து ஐந்து', 'முப்பத்துஐந்து', 'தர்டி ஃபைவ்'],\n",
63
- " 'thirty six': ['முப்பத்து ஆறு', 'முப்பத்துஆறு', 'தர்டி சிக்ஸ்'],\n",
64
- " 'thirty seven': ['முப்பத்து ஏழு', 'முப்பத்துஏழு', 'தர்டி செவன்'],\n",
65
- " 'thirty eight': ['முப்பத்து எட்டு', 'முப்பத்துஎட்டு', 'தர்டி ஏட்'],\n",
66
- " 'thirty nine': ['முப்பத்து ஒன்பது', 'முப்பத்தொன்பது', 'தர்டி நைன்'],\n",
67
- "\n",
68
- " # Numbers from 41 to 49\n",
69
- " 'forty one': ['நாற்பத்து ஒன்று', 'நாற்பத்தொன்று', 'ஃபோர்டி ஒன்'],\n",
70
- " 'forty two': ['நாற்பத்து இரண்டு', 'நாற்பத்திரண்டு', 'ஃபோர்டி டூ'],\n",
71
- " 'forty three': ['நாற்பத்து மூன்று', 'நாற்பத்துமூன்று', 'ஃபோர்டி த்ரீ'],\n",
72
- " 'forty four': ['நாற்பத்து நான்கு', 'நாற்பத்துநான்கு', 'ஃபோர்டி ஃபோர்'],\n",
73
- " 'forty five': ['நாற்பத்து ஐந்து', 'நாற்பத்துஐந்து', 'ஃபோர்டி ஃபைவ்'],\n",
74
- " 'forty six': ['நாற்பத்து ஆறு', 'நாற்பத்துஆறு', 'ஃபோர்டி சிக்ஸ்'],\n",
75
- " 'forty seven': ['நாற்பத்து ஏழு', 'நாற்பத்துஏழு', 'ஃபோர்டி செவன்'],\n",
76
- " 'forty eight': ['நாற்பத்து எட்டு', 'நாற்பத்துஎட்டு', 'ஃபோர்டி ஏட்'],\n",
77
- " 'forty nine': ['நாற்பத்து ஒன்பது', 'நாற்பத்தொன்பது', 'ஃபோர்டி நைன்'],\n",
78
- "\n",
79
- " # Numbers from 51 to 59\n",
80
- " 'fifty one': ['ஐம்பத்து ஒன்று', 'ஐம்பத்தொன்று', 'ஃபிப்டி ஒன்'],\n",
81
- " 'fifty two': ['ஐம்பத்து இரண்டு', 'ஐம்பத்திரண்டு', 'ஃபிப்டி டூ'],\n",
82
- " 'fifty three': ['ஐம்பத்து மூன்று', 'ஐம்பத்துமூன்று', 'ஃபிப்டி த்ரீ'],\n",
83
- " 'fifty four': ['ஐம்பத்து நான்கு', 'ஐம்பத்துநான்கு', 'ஃபிப்டி ஃபோர்'],\n",
84
- " 'fifty five': ['ஐம்பத்து ஐந்து', 'ஐம்பத்துஐந்து', 'ஃபிப்டி ஃபைவ்'],\n",
85
- " 'fifty six': ['ஐம்பத்து ஆறு', 'ஐம்பத்துஆறு', 'ஃபிப்டி சிக்ஸ்'],\n",
86
- " 'fifty seven': ['ஐம்பத்து ஏழு', 'ஐம்பத்துஏழு', 'ஃபிப்டி செவன்'],\n",
87
- " 'fifty eight': ['ஐம்பத்து எட்டு', 'ஐம்பத்துஎட்டு', 'ஃபிப்டி ஏட்'],\n",
88
- " 'fifty nine': ['ஐம்பத்து ஒன்பது', 'ஐம்பத்தொன்பது', 'ஃபிப்டி நைன்'],\n",
89
- " \n",
90
- " # Numbers from 61 to 69\n",
91
- " 'sixty one': ['அறுபத்து ஒன்று', 'அறுபத்தொன்று', 'சிக்ஸ்டி ஒன்'],\n",
92
- " 'sixty two': ['அறுபத்து இரண்டு', 'அறுபத்திரண்டு', 'சிக்ஸ்டி டூ'],\n",
93
- " 'sixty three': ['அறுபத்து மூன்று', 'அறுபத்துமூன்று', 'சிக்ஸ்டி த்ரீ'],\n",
94
- " 'sixty four': ['அறுபத்து நான்கு', 'அறுபத்துநான்கு', 'சிக்ஸ்டி ஃபோர்'],\n",
95
- " 'sixty five': ['அறுபத்து ஐந்து', 'அறுபத்துஐந்து', 'சிக்ஸ்டி ஃபைவ்'],\n",
96
- " 'sixty six': ['அறுபத்து ஆறு', 'அறுபத்துஆறு', 'சிக்ஸ்டி சிக்ஸ்'],\n",
97
- " 'sixty seven': ['அறுபத்து ஏழு', 'அறுபத்துஏழு', 'சிக்ஸ்டி செவன்'],\n",
98
- " 'sixty eight': ['அறுபத்து எட்டு', 'அறுபத்துஎட்டு', 'சிக்ஸ்டி ஏட்'],\n",
99
- " 'sixty nine': ['அறுபத்து ஒன்பது', 'அறுபத்தொன்பது', 'சிக்ஸ்டி நைன்'],\n",
100
- "\n",
101
- " # Numbers from 71 to 79\n",
102
- " 'seventy one': ['எழுபத்து ஒன்று', 'எழுபத்தொன்று', 'செவன்டி ஒன்'],\n",
103
- " 'seventy two': ['எழுபத்து இரண்டு', 'எழுபத்திரண்டு', 'செவன்டி டூ'],\n",
104
- " 'seventy three': ['எழுபத்து மூன்று', 'எழுபத்துமூன்று', 'செவன்டி த்ரீ'],\n",
105
- " 'seventy four': ['எழுபத்து நான்கு', 'எழுபத்துநான்கு', 'செவன்டி ஃபோர்'],\n",
106
- " 'seventy five': ['எழுபத்து ஐந்து', 'எழுபத்துஐந்து', 'செவன்டி ஃபைவ்'],\n",
107
- " 'seventy six': ['எழுபத்து ஆறு', 'எழுபத்துஆறு', 'செவன்டி சிக்ஸ்'],\n",
108
- " 'seventy seven': ['எழுபத்து ஏழு', 'எழுபத்துஏழு', 'செவன்டி செவன்'],\n",
109
- " 'seventy eight': ['எழுபத்து எட்டு', 'எழுபத்துஎட்டு', 'செவன்டி ஏட்'],\n",
110
- " 'seventy nine': ['எழுபத்து ஒன்பது', 'எழுபத்தொன்பது', 'செவன்டி நைன்'],\n",
111
- "\n",
112
- " # Numbers from 81 to 89\n",
113
- " 'eighty one': ['எண்பத்து ஒன்று', 'எண்பத்தொன்று', 'ஏட்டி ஒன்'],\n",
114
- " 'eighty two': ['எண்பத்து இரண்டு', 'எண்பத்திரண்டு', 'ஏட்டி டூ'],\n",
115
- " 'eighty three': ['எண்பத்து மூன்று', 'எண்பத்துமூன்று', 'ஏட்டி த்ரீ'],\n",
116
- " 'eighty four': ['எண்பத்து நான்கு', 'எண்பத்துநான்கு', 'ஏட்டி ஃபோர்'],\n",
117
- " 'eighty five': ['எண்பத்து ஐந்து', 'எண்பத்துஐந்து', 'ஏட்டி ஃபைவ்'],\n",
118
- " 'eighty six': ['எண்பத்து ஆறு', 'எண்பத்துஆறு', 'ஏட்டி சிக்ஸ்'],\n",
119
- " 'eighty seven': ['எண்பத்து ஏழு', 'எண்பத்துஏழு', 'ஏட்டி செவன்'],\n",
120
- " 'eighty eight': ['எண்பத்து எட்டு', 'எண்பத்துஎட்டு', 'ஏட்டி ஏட்'],\n",
121
- " 'eighty nine': ['எண்பத்து ஒன்பது', 'எண்பத்தொன்பது', 'ஏட்டி நைன்'],\n",
122
- "\n",
123
- " # Numbers from 91 to 99\n",
124
- " 'ninety one': ['தொண்ணூற்று ஒன்று', 'தொண்ணூற்றொன்று', 'நைன்டி ஒன்'],\n",
125
- " 'ninety two': ['தொண்ணூற்று இரண்டு', 'தொண்ணூற்றிரண்டு', 'நைன்டி டூ'],\n",
126
- " 'ninety three': ['தொண்ணூற்று மூன்று', 'தொண்ணூற்றுமூன்று', 'நைன்டி த்ரீ'],\n",
127
- " 'ninety four': ['தொண்ணூற்று நான்கு', 'தொண்ணூற்றுநான்கு', 'நைன்டி ஃபோர்'],\n",
128
- " 'ninety five': ['தொண்ணூற்று ஐந்து', 'தொண்ணூற்றுஐந்து', 'நைன்டி ஃபைவ்'],\n",
129
- " 'ninety six': ['தொண்ணூற்று ஆறு', 'தொண்ணூற்றுஆறு', 'நைன்டி சிக்ஸ்'],\n",
130
- " 'ninety seven': ['தொண்ணூற்று ஏழு', 'தொண்ணூற்றுஏழு', 'நைன்டி செவன்'],\n",
131
- " 'ninety eight': ['தொண்ணூற்று எட்டு', 'தொண்ணூற்றுஎட்டு', 'நைன்டி ஏட்'],\n",
132
- " 'ninety nine': ['தொண்ணூற்று ஒன்பது', 'தொண்ணூற்றொன்பது', 'நைன்டி நைன்'],\n",
133
- "\n",
134
- " # Hundred\n",
135
- " 'hundred': ['நூறு', 'நூறை', 'ஹண்ட்ரெட்'],\n",
136
- " # Thousand\n",
137
- " 'thousand': ['ஆயிரம்'],\n",
138
- " }\n",
139
- " \n",
140
- " words = sentence.split() # Split the sentence by spaces\n",
141
- " \n",
142
- " # Replace words using the mapping\n",
143
- " for i, word in enumerate(words):\n",
144
- " for replacement, patterns in replacement_map.items():\n",
145
- " if word in patterns:\n",
146
- " words[i] = replacement # Replace the word if it's fully matched\n",
147
- " \n",
148
- " # Join the processed words back into a sentence\n",
149
- " return ' '.join(words)"
150
- ]
151
- },
152
- {
153
- "cell_type": "code",
154
- "execution_count": null,
155
- "id": "7bdb593a-cb68-4b04-af8d-b61ea396a5eb",
156
- "metadata": {},
157
- "outputs": [],
158
- "source": []
159
- }
160
- ],
161
- "metadata": {
162
- "kernelspec": {
163
- "display_name": "Python 3 (ipykernel)",
164
- "language": "python",
165
- "name": "python3"
166
- },
167
- "language_info": {
168
- "codemirror_mode": {
169
- "name": "ipython",
170
- "version": 3
171
- },
172
- "file_extension": ".py",
173
- "mimetype": "text/x-python",
174
- "name": "python",
175
- "nbconvert_exporter": "python",
176
- "pygments_lexer": "ipython3",
177
- "version": "3.11.7"
178
- }
179
- },
180
- "nbformat": 4,
181
- "nbformat_minor": 5
182
- }