{ "cells": [ { "cell_type": "code", "execution_count": 9, "id": "19bbb494-3054-48ae-9b64-7f0756c0532d", "metadata": {}, "outputs": [], "source": [ "import re\n", "def replace_words(sentence):\n", " replacement_map = {\n", " # Single digits\n", " 'one': ['ஒன்று', 'ஒன்னு', 'ஒன்'],\n", " 'two': ['இரண்டு', 'ரெண்டு', 'டூ'],\n", " 'three': ['மூன்று', 'முன்னு', 'த்ரீ'],\n", " 'four': ['நான்கு', 'நாலு', 'ஃபோர்'],\n", " 'five': ['ஐந்து', 'அஞ்சு', 'ஃபைவ்'],\n", " 'six': ['ஆறு', 'ஆறு', 'சிக்ஸ்'],\n", " 'seven': ['ஏழு', 'எழு', 'செவன்'],\n", " 'eight': ['எட்டு', 'எட்டு', 'எய்ட்'],\n", " 'nine': ['ஒன்பது', 'ஒம்பது', 'நைன்'],\n", " 'ten': ['பத்து', 'பத்து', 'டென'],\n", "\n", " # Numbers from 11 to 19\n", " 'eleven': ['பதினொன்று', 'பதினொன்னு', 'எலெவன்'],\n", " 'twelve': ['பன்னிரண்டு', 'பன்னிரண்டு', 'ட்வெல்வ்'],\n", " 'thirteen': ['பதின்மூன்று', 'பதின்முன்னு', 'தர்டீன்'],\n", " 'fourteen': ['பதினான்கு', 'பதின்நாலு', 'ஃபோர்டீன்'],\n", " 'fifteen': ['பதினைந்து', 'பதினஞ்சு', 'ஃபிப்டீன்'],\n", " 'sixteen': ['பதினாறு', 'பதினாறோ', 'சிக்ஸ்டீன்'],\n", " 'seventeen': ['பதினேழு', 'பதினேழு', 'செவன்டீன்'],\n", " 'eighteen': ['பதினெட்டு', 'பதினெட்டு', 'ஏட்டீன்'],\n", " 'nineteen': ['பத்தொன்பது', 'பத்தொம்பது', 'நைன்டீன்'],\n", "\n", " # Multiples of ten\n", " 'twenty': ['இருபது', 'இருபத்து', 'ட்வென்டி'],\n", " 'thirty': ['முப்பது', 'முப்பத்து', 'தர்டி'],\n", " 'forty': ['நாற்பது', 'நாற்பத்து', 'ஃபோர்டி'],\n", " 'fifty': ['ஐம்பது', 'ஐம்பத்து', 'ஃபிப்டி'],\n", " 'sixty': ['அறுபது', 'அறுபத்து', 'சிக்ஸ்டி'],\n", " 'seventy': ['எழுபது', 'எழுபத்து', 'செவன்டி'],\n", " 'eighty': ['எண்பது', 'எண்பத்து', 'ஏட்டி'],\n", " 'ninety': ['தொண்ணூறு', 'தொன்னூறு', 'நைன்டி'],\n", "\n", " # Numbers from 21 to 29\n", " 'twenty one': ['இருபத்து ஒன்று', 'இருபத்தொன்று', 'ட்வென்டி ஒன்'],\n", " 'twenty two': ['இருபத்து இரண்டு', 'இருபத்திரண்டு', 'ட்வென்டி டூ'],\n", " 'twenty three': ['இருபத்து மூன்று', 'இருபத்துமூன்று', 'ட்வென்டி த்ரீ'],\n", " 'twenty four': ['இருபத்து நான்கு', 'இருபத்துநான்கு', 'ட்வென்டி ஃபோர்'],\n", " 'twenty five': ['இருபத்து ஐந்து', 'இருபத்துஐந்து', 'ட்வென்டி ஃபைவ்'],\n", " 'twenty six': ['இருபத்து ஆறு', 'இருபத்துஆறு', 'ட்வென்டி சிக்ஸ்'],\n", " 'twenty seven': ['இருபத்து ஏழு', 'இருபத்துஏழு', 'ட்வென்டி செவன்'],\n", " 'twenty eight': ['இருபத்து எட்டு', 'இருபத்துஎட்டு', 'ட்வென்டி ஏட்'],\n", " 'twenty nine': ['இருபத்து ஒன்பது', 'இருபத்தொன்பது', 'ட்வென்டி நைன்'],\n", "\n", " # Numbers from 31 to 39\n", " 'thirty one': ['முப்பத்து ஒன்று', 'முப்பத்தொன்று', 'தர்டி ஒன்'],\n", " 'thirty two': ['முப்பத்து இரண்டு', 'முப்பத்திரண்டு', 'தர்டி டூ'],\n", " 'thirty three': ['முப்பத்து மூன்று', 'முப்பத்துமூன்று', 'தர்டி த்ரீ'],\n", " 'thirty four': ['முப்பத்து நான்கு', 'முப்பத்துநான்கு', 'தர்டி ஃபோர்'],\n", " 'thirty five': ['முப்பத்து ஐந்து', 'முப்பத்துஐந்து', 'தர்டி ஃபைவ்'],\n", " 'thirty six': ['முப்பத்து ஆறு', 'முப்பத்துஆறு', 'தர்டி சிக்ஸ்'],\n", " 'thirty seven': ['முப்பத்து ஏழு', 'முப்பத்துஏழு', 'தர்டி செவன்'],\n", " 'thirty eight': ['முப்பத்து எட்டு', 'முப்பத்துஎட்டு', 'தர்டி ஏட்'],\n", " 'thirty nine': ['முப்பத்து ஒன்பது', 'முப்பத்தொன்பது', 'தர்டி நைன்'],\n", "\n", " # Numbers from 41 to 49\n", " 'forty one': ['நாற்பத்து ஒன்று', 'நாற்பத்தொன்று', 'ஃபோர்டி ஒன்'],\n", " 'forty two': ['நாற்பத்து இரண்டு', 'நாற்பத்திரண்டு', 'ஃபோர்டி டூ'],\n", " 'forty three': ['நாற்பத்து மூன்று', 'நாற்பத்துமூன்று', 'ஃபோர்டி த்ரீ'],\n", " 'forty four': ['நாற்பத்து நான்கு', 'நாற்பத்துநான்கு', 'ஃபோர்டி ஃபோர்'],\n", " 'forty five': ['நாற்பத்து ஐந்து', 'நாற்பத்துஐந்து', 'ஃபோர்டி ஃபைவ்'],\n", " 'forty six': ['நாற்பத்து ஆறு', 'நாற்பத்துஆறு', 'ஃபோர்டி சிக்ஸ்'],\n", " 'forty seven': ['நாற்பத்து ஏழு', 'நாற்பத்துஏழு', 'ஃபோர்டி செவன்'],\n", " 'forty eight': ['நாற்பத்து எட்டு', 'நாற்பத்துஎட்டு', 'ஃபோர்டி ஏட்'],\n", " 'forty nine': ['நாற்பத்து ஒன்பது', 'நாற்பத்தொன்பது', 'ஃபோர்டி நைன்'],\n", "\n", " # Numbers from 51 to 59\n", " 'fifty one': ['ஐம்பத்து ஒன்று', 'ஐம்பத்தொன்று', 'ஃபிப்டி ஒன்'],\n", " 'fifty two': ['ஐம்பத்து இரண்டு', 'ஐம்பத்திரண்டு', 'ஃபிப்டி டூ'],\n", " 'fifty three': ['ஐம்பத்து மூன்று', 'ஐம்பத்துமூன்று', 'ஃபிப்டி த்ரீ'],\n", " 'fifty four': ['ஐம்பத்து நான்கு', 'ஐம்பத்துநான்கு', 'ஃபிப்டி ஃபோர்'],\n", " 'fifty five': ['ஐம்பத்து ஐந்து', 'ஐம்பத்துஐந்து', 'ஃபிப்டி ஃபைவ்'],\n", " 'fifty six': ['ஐம்பத்து ஆறு', 'ஐம்பத்துஆறு', 'ஃபிப்டி சிக்ஸ்'],\n", " 'fifty seven': ['ஐம்பத்து ஏழு', 'ஐம்பத்துஏழு', 'ஃபிப்டி செவன்'],\n", " 'fifty eight': ['ஐம்பத்து எட்டு', 'ஐம்பத்துஎட்டு', 'ஃபிப்டி ஏட்'],\n", " 'fifty nine': ['ஐம்பத்து ஒன்பது', 'ஐம்பத்தொன்பது', 'ஃபிப்டி நைன்'],\n", " \n", " # Numbers from 61 to 69\n", " 'sixty one': ['அறுபத்து ஒன்று', 'அறுபத்தொன்று', 'சிக்ஸ்டி ஒன்'],\n", " 'sixty two': ['அறுபத்து இரண்டு', 'அறுபத்திரண்டு', 'சிக்ஸ்டி டூ'],\n", " 'sixty three': ['அறுபத்து மூன்று', 'அறுபத்துமூன்று', 'சிக்ஸ்டி த்ரீ'],\n", " 'sixty four': ['அறுபத்து நான்கு', 'அறுபத்துநான்கு', 'சிக்ஸ்டி ஃபோர்'],\n", " 'sixty five': ['அறுபத்து ஐந்து', 'அறுபத்துஐந்து', 'சிக்ஸ்டி ஃபைவ்'],\n", " 'sixty six': ['அறுபத்து ஆறு', 'அறுபத்துஆறு', 'சிக்ஸ்டி சிக்ஸ்'],\n", " 'sixty seven': ['அறுபத்து ஏழு', 'அறுபத்துஏழு', 'சிக்ஸ்டி செவன்'],\n", " 'sixty eight': ['அறுபத்து எட்டு', 'அறுபத்துஎட்டு', 'சிக்ஸ்டி ஏட்'],\n", " 'sixty nine': ['அறுபத்து ஒன்பது', 'அறுபத்தொன்பது', 'சிக்ஸ்டி நைன்'],\n", "\n", " # Numbers from 71 to 79\n", " 'seventy one': ['எழுபத்து ஒன்று', 'எழுபத்தொன்று', 'செவன்டி ஒன்'],\n", " 'seventy two': ['எழுபத்து இரண்டு', 'எழுபத்திரண்டு', 'செவன்டி டூ'],\n", " 'seventy three': ['எழுபத்து மூன்று', 'எழுபத்துமூன்று', 'செவன்டி த்ரீ'],\n", " 'seventy four': ['எழுபத்து நான்கு', 'எழுபத்துநான்கு', 'செவன்டி ஃபோர்'],\n", " 'seventy five': ['எழுபத்து ஐந்து', 'எழுபத்துஐந்து', 'செவன்டி ஃபைவ்'],\n", " 'seventy six': ['எழுபத்து ஆறு', 'எழுபத்துஆறு', 'செவன்டி சிக்ஸ்'],\n", " 'seventy seven': ['எழுபத்து ஏழு', 'எழுபத்துஏழு', 'செவன்டி செவன்'],\n", " 'seventy eight': ['எழுபத்து எட்டு', 'எழுபத்துஎட்டு', 'செவன்டி ஏட்'],\n", " 'seventy nine': ['எழுபத்து ஒன்பது', 'எழுபத்தொன்பது', 'செவன்டி நைன்'],\n", "\n", " # Numbers from 81 to 89\n", " 'eighty one': ['எண்பத்து ஒன்று', 'எண்பத்தொன்று', 'ஏட்டி ஒன்'],\n", " 'eighty two': ['எண்பத்து இரண்டு', 'எண்பத்திரண்டு', 'ஏட்டி டூ'],\n", " 'eighty three': ['எண்பத்து மூன்று', 'எண்பத்துமூன்று', 'ஏட்டி த்ரீ'],\n", " 'eighty four': ['எண்பத்து நான்கு', 'எண்பத்துநான்கு', 'ஏட்டி ஃபோர்'],\n", " 'eighty five': ['எண்பத்து ஐந்து', 'எண்பத்துஐந்து', 'ஏட்டி ஃபைவ்'],\n", " 'eighty six': ['எண்பத்து ஆறு', 'எண்பத்துஆறு', 'ஏட்டி சிக்ஸ்'],\n", " 'eighty seven': ['எண்பத்து ஏழு', 'எண்பத்துஏழு', 'ஏட்டி செவன்'],\n", " 'eighty eight': ['எண்பத்து எட்டு', 'எண்பத்துஎட்டு', 'ஏட்டி ஏட்'],\n", " 'eighty nine': ['எண்பத்து ஒன்பது', 'எண்பத்தொன்பது', 'ஏட்டி நைன்'],\n", "\n", " # Numbers from 91 to 99\n", " 'ninety one': ['தொண்ணூற்று ஒன்று', 'தொண்ணூற்றொன்று', 'நைன்டி ஒன்'],\n", " 'ninety two': ['தொண்ணூற்று இரண்டு', 'தொண்ணூற்றிரண்டு', 'நைன்டி டூ'],\n", " 'ninety three': ['தொண்ணூற்று மூன்று', 'தொண்ணூற்றுமூன்று', 'நைன்டி த்ரீ'],\n", " 'ninety four': ['தொண்ணூற்று நான்கு', 'தொண்ணூற்றுநான்கு', 'நைன்டி ஃபோர்'],\n", " 'ninety five': ['தொண்ணூற்று ஐந்து', 'தொண்ணூற்றுஐந்து', 'நைன்டி ஃபைவ்'],\n", " 'ninety six': ['தொண்ணூற்று ஆறு', 'தொண்ணூற்றுஆறு', 'நைன்டி சிக்ஸ்'],\n", " 'ninety seven': ['தொண்ணூற்று ஏழு', 'தொண்ணூற்றுஏழு', 'நைன்டி செவன்'],\n", " 'ninety eight': ['தொண்ணூற்று எட்டு', 'தொண்ணூற்றுஎட்டு', 'நைன்டி ஏட்'],\n", " 'ninety nine': ['தொண்ணூற்று ஒன்பது', 'தொண்ணூற்றொன்பது', 'நைன்டி நைன்'],\n", "\n", " # Hundred\n", " 'hundred': ['நூறு', 'நூறை', 'ஹண்ட்ரெட்'],\n", " # Thousand\n", " 'thousand': ['ஆயிரம்'],\n", " }\n", " \n", " words = sentence.split() # Split the sentence by spaces\n", " \n", " # Replace words using the mapping\n", " for i, word in enumerate(words):\n", " for replacement, patterns in replacement_map.items():\n", " if word in patterns:\n", " words[i] = replacement # Replace the word if it's fully matched\n", " \n", " # Join the processed words back into a sentence\n", " return ' '.join(words)" ] }, { "cell_type": "code", "execution_count": null, "id": "7bdb593a-cb68-4b04-af8d-b61ea396a5eb", "metadata": {}, "outputs": [], "source": [] } ], "metadata": { "kernelspec": { "display_name": "Python 3 (ipykernel)", "language": "python", "name": "python3" }, "language_info": { "codemirror_mode": { "name": "ipython", "version": 3 }, "file_extension": ".py", "mimetype": "text/x-python", "name": "python", "nbconvert_exporter": "python", "pygments_lexer": "ipython3", "version": "3.11.7" } }, "nbformat": 4, "nbformat_minor": 5 }