Spaces:

cdactvm
/

Tamil_ASR_Demo

Running

App Files Files Community

cdactvm commited on Dec 11, 2024

Commit

b161c5a

verified ·

1 Parent(s): f155e22

Update app.py

Browse files

Files changed (1) hide show

app.py +8 -40

app.py CHANGED Viewed

@@ -29,10 +29,8 @@ from wienerFilter import wiener_filter
 from highPassFilter import high_pass_filter
 from waveletDenoise import wavelet_denoise
 transcriber_hindi_new = pipeline(task="automatic-speech-recognition", model="cdactvm/w2v-bert-tamil_new")
-transcriber_hindi_old = pipeline(task="automatic-speech-recognition", model="cdactvm/w2v-bert-tamil_new")
 processor = AutoProcessor.from_pretrained("cdactvm/w2v-bert-tamil_new")
 vocab_dict = processor.tokenizer.get_vocab()
 sorted_vocab_dict = {k.lower(): v for k, v in sorted(vocab_dict.items(), key=lambda item: item[1])}
@@ -40,16 +38,16 @@ decoder = build_ctcdecoder(
     labels=list(sorted_vocab_dict.keys()),
     kenlm_model_path="lm.binary",
     )
-processor_with_lm = Wav2Vec2ProcessorWithLM(
-    feature_extractor=processor.feature_extractor,
-    tokenizer=processor.tokenizer,
-    decoder=decoder
-    )
 processor.feature_extractor._processor_class = "Wav2Vec2ProcessorWithLM"
-transcriber_hindi_lm = pipeline("automatic-speech-recognition", model="cdactvm/w2v-bert-tamil_new", tokenizer=processor_with_lm, feature_extractor=processor_with_lm.feature_extractor, decoder=processor_with_lm.decoder)
-def transcribe_hindi_new(audio):
     # # Process the audio file
     transcript = transcriber_hindi_new(audio)
     text_value = transcript['text']
@@ -58,24 +56,6 @@ def transcribe_hindi_new(audio):
     converted_text=text_to_int(replaced_words)
     return converted_text
-def transcribe_hindi_lm(audio):
-    # # Process the audio file
-    transcript = transcriber_hindi_lm(audio)
-    text_value = transcript['text']
-    processd_doubles=process_doubles(text_value)
-    replaced_words = replace_words(processd_doubles)
-    converted_text=text_to_int(replaced_words)
-    return converted_text
-def transcribe_hindi_old(audio):
-    # # Process the audio file
-    transcript = transcriber_hindi_old(audio)
-    text_value = transcript['text']
-    cleaned_text=text_value.replace("<s>","")
-    processd_doubles=process_doubles(cleaned_text)
-    replaced_words = replace_words(processd_doubles)
-    converted_text=text_to_int(replaced_words)
-    return converted_text
 ###############################################
 # implementation of noise reduction techniques.
@@ -131,18 +111,6 @@ def sel_lng(lng, mic=None, file=None):
         return Noise_cancellation_function(audio)
-# demo=gr.Interface(
-#     transcribe,
-#     inputs=[
-#         gr.Audio(sources=["microphone","upload"], type="filepath"),
-#     ],
-#     outputs=[
-#         "textbox"
-#     ],
-#     title="Automatic Speech Recognition",
-#     description = "Demo for Automatic Speech Recognition. Use microphone to record speech. Please press Record button. Initially it will take some time to load the model. The recognized text will appear in the output textbox",
-#       ).launch()
 demo=gr.Interface(
     fn=sel_lng,

 from highPassFilter import high_pass_filter
 from waveletDenoise import wavelet_denoise
 transcriber_hindi_new = pipeline(task="automatic-speech-recognition", model="cdactvm/w2v-bert-tamil_new")
+# transcriber_hindi_old = pipeline(task="automatic-speech-recognition", model="cdactvm/w2v-bert-tamil_new")
 processor = AutoProcessor.from_pretrained("cdactvm/w2v-bert-tamil_new")
 vocab_dict = processor.tokenizer.get_vocab()
 sorted_vocab_dict = {k.lower(): v for k, v in sorted(vocab_dict.items(), key=lambda item: item[1])}
     labels=list(sorted_vocab_dict.keys()),
     kenlm_model_path="lm.binary",
     )
+# processor_with_lm = Wav2Vec2ProcessorWithLM(
+#     feature_extractor=processor.feature_extractor,
+#     tokenizer=processor.tokenizer,
+#     decoder=decoder
+#     )
 processor.feature_extractor._processor_class = "Wav2Vec2ProcessorWithLM"
+# transcriber_hindi_lm = pipeline("automatic-speech-recognition", model="cdactvm/w2v-bert-tamil_new", tokenizer=processor_with_lm, feature_extractor=processor_with_lm.feature_extractor, decoder=processor_with_lm.decoder)
+def transcribe_tamil_new(audio):
     # # Process the audio file
     transcript = transcriber_hindi_new(audio)
     text_value = transcript['text']
     converted_text=text_to_int(replaced_words)
     return converted_text
 ###############################################
 # implementation of noise reduction techniques.
         return Noise_cancellation_function(audio)
 demo=gr.Interface(
     fn=sel_lng,