Spaces:

LAP-DEV
/

Demo

Running

LAP-DEV commited on Nov 13, 2024

Commit

6bf4144

verified ·

1 Parent(s): 942f953

Update modules/whisper/whisper_base.py

Files changed (1) hide show

modules/whisper/whisper_base.py CHANGED Viewed

@@ -229,11 +229,13 @@ class WhisperBase(ABC):
                 mel = whisper.log_mel_spectrogram(whisper.pad_or_trim(whisper.load_audio(file))).to(model.device)
                 _, probs = model.detect_language(mel)
                 file_language = ""
                 for key,value in whisper.tokenizer.LANGUAGES.items():
                     if key == str(max(probs, key=probs.get)):
                         file_language = value.capitalize()
                         break
                 transcribed_segments, time_for_task = self.run(
                     file,
                     progress,
@@ -249,7 +251,7 @@ class WhisperBase(ABC):
                     file_format=file_format,
                     output_dir=self.output_dir
                 )
-                files_info[file_name] = {"subtitle": subtitle, "time_for_task": time_for_task, "path": file_path, "lang": file_language, "lang_prob": str(probs), "input_source_file": (file_name+file_ext)}
                 ## Add output file as txt
                 file_name, file_ext = os.path.splitext(os.path.basename(file))

                 mel = whisper.log_mel_spectrogram(whisper.pad_or_trim(whisper.load_audio(file))).to(model.device)
                 _, probs = model.detect_language(mel)
                 file_language = ""
+                file_lang_probs = ""
                 for key,value in whisper.tokenizer.LANGUAGES.items():
                     if key == str(max(probs, key=probs.get)):
                         file_language = value.capitalize()
+                        file_lang_probs = str(max(probs, key=probs.get))
                         break
                 transcribed_segments, time_for_task = self.run(
                     file,
                     progress,
                     file_format=file_format,
                     output_dir=self.output_dir
                 )
+                files_info[file_name] = {"subtitle": subtitle, "time_for_task": time_for_task, "path": file_path, "lang": file_language, "lang_prob": file_lang_probs, "input_source_file": (file_name+file_ext)}
                 ## Add output file as txt
                 file_name, file_ext = os.path.splitext(os.path.basename(file))