Spaces:

cdactvm
/

Tamil_ASR_Demo

Sleeping

cdactvm commited on Dec 11, 2024

Commit

3137a68

verified ·

1 Parent(s): b161c5a

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -34,10 +34,10 @@ transcriber_hindi_new = pipeline(task="automatic-speech-recognition", model="cda
 processor = AutoProcessor.from_pretrained("cdactvm/w2v-bert-tamil_new")
 vocab_dict = processor.tokenizer.get_vocab()
 sorted_vocab_dict = {k.lower(): v for k, v in sorted(vocab_dict.items(), key=lambda item: item[1])}
-decoder = build_ctcdecoder(
-    labels=list(sorted_vocab_dict.keys()),
-    kenlm_model_path="lm.binary",
-    )
 # processor_with_lm = Wav2Vec2ProcessorWithLM(
 #     feature_extractor=processor.feature_extractor,
 #     tokenizer=processor.tokenizer,

 processor = AutoProcessor.from_pretrained("cdactvm/w2v-bert-tamil_new")
 vocab_dict = processor.tokenizer.get_vocab()
 sorted_vocab_dict = {k.lower(): v for k, v in sorted(vocab_dict.items(), key=lambda item: item[1])}
+# decoder = build_ctcdecoder(
+#     labels=list(sorted_vocab_dict.keys()),
+#     kenlm_model_path="lm.binary",
+#     )
 # processor_with_lm = Wav2Vec2ProcessorWithLM(
 #     feature_extractor=processor.feature_extractor,
 #     tokenizer=processor.tokenizer,