Spaces:

chompionsawelo
/

whisper_transcribe

Runtime error

App Files Files Community

chompionsawelo commited on Aug 16, 2023

Commit

f36ca6d

1 Parent(s): eb6aaad

file name fixes

Browse files

Files changed (5) hide show

adjust.py +4 -4
file_name.py +29 -10
set_up.py +12 -12
utils.py +13 -13
video_tool.py +6 -4

adjust.py CHANGED Viewed

@@ -1,11 +1,11 @@
 from ui import *
 from pydub import AudioSegment
 from utils import load_groups_json
 from video_tool import add_subtitle_to_video
 import gradio as gr
 import os
 import utils
-import file_name
 min_duration_ms = 10000
 current_pos = 0
@@ -102,16 +102,16 @@ def start_adjust(to_name, progress=gr.Progress()):
     # Adding subtitle to video
     progress(0.8, desc=ui_lang["progress_add_subtitle"])
     add_subtitle_to_video(
-        file_name.input_file, file_name.subtitle_adjusted_file, file_name.video_subtitle_file, file_name.start_time_for_adjustment, file_name.end_time_for_adjustment)
     # Return video file link, transcribe string, transcribe.txt, subtitle.txt
     transcribe_txt_list, _ = utils.read_transcribe_subtitle_file(True)
     print(line for line in transcribe_txt_list)
     transcribe_txt = "\n".join(transcribe_txt_list)
     return [
-        file_name.video_subtitle_file,
         transcribe_txt,
-        [file_name.transcribe_adjusted_file, file_name.subtitle_adjusted_file]
     ]

 from ui import *
+from file_name import *
 from pydub import AudioSegment
 from utils import load_groups_json
 from video_tool import add_subtitle_to_video
 import gradio as gr
 import os
 import utils
 min_duration_ms = 10000
 current_pos = 0
     # Adding subtitle to video
     progress(0.8, desc=ui_lang["progress_add_subtitle"])
     add_subtitle_to_video(
+        current_input_file, get_subtitle_adjusted_file(), get_video_subtitle_file(), start_time_for_adjustment(), end_time_for_adjustment)
     # Return video file link, transcribe string, transcribe.txt, subtitle.txt
     transcribe_txt_list, _ = utils.read_transcribe_subtitle_file(True)
     print(line for line in transcribe_txt_list)
     transcribe_txt = "\n".join(transcribe_txt_list)
     return [
+        get_video_subtitle_file(),
         transcribe_txt,
+        [get_transcribe_adjusted_file(), get_subtitle_adjusted_file()]
     ]

file_name.py CHANGED Viewed

@@ -1,22 +1,41 @@
 import os
 def get_title():
-    return os.path.basename(input_file)
-current_working_directory = os.getcwd()
-input_file = ""
-audio_file = f"{current_working_directory}/input_{get_title()}.wav"
-transcribe_file = f"{current_working_directory}/transcribe_{get_title()}.txt"
-subtitle_file = f"{current_working_directory}/subtitle_{get_title()}.srt"
-transcribe_adjusted_file = f"{current_working_directory}/transcribe_adjusted_{get_title()}.txt"
-subtitle_adjusted_file = f"{current_working_directory}/subtitle_adjusted_{get_title()}.srt"
-video_subtitle_file = f"{current_working_directory}/output_{get_title()}.mp4"
 start_time_for_adjustment = "00:00:00"
-end_time_for_adjustment = "00:10:00"
 sample_groups_json = "sample_groups.json"
 speaker_groups_json = "speaker_groups.json"

 import os
+current_working_directory = os.getcwd()
+current_input_file = ""
 def get_title():
+    return os.path.basename(current_input_file)
+def get_audio_file():
+    return f"{current_working_directory}/input_{get_title()}.wav"
+def get_transcribe_file():
+    return f"{current_working_directory}/transcribe_{get_title()}.txt"
+def get_subtitle_file():
+    return f"{current_working_directory}/subtitle_{get_title()}.srt"
+def get_transcribe_adjusted_file():
+    return f"{current_working_directory}/transcribe_adjusted_{get_title()}.txt"
+def get_subtitle_adjusted_file():
+    return f"{current_working_directory}/subtitle_adjusted_{get_title()}.srt"
+def get_video_subtitle_file():
+    return f"{current_working_directory}/output_{get_title()}.mp4"
 start_time_for_adjustment = "00:00:00"
+end_time_for_adjustment = "01:00:00"
 sample_groups_json = "sample_groups.json"
 speaker_groups_json = "speaker_groups.json"

set_up.py CHANGED Viewed

@@ -1,11 +1,11 @@
 from ui import *
 from diarization import start_diarization
 from transcribe import start_transcribe
 from video_tool import convert_video_to_audio, add_subtitle_to_video
 import gradio as gr
 import re
 import os
-import file_name
 import utils
@@ -28,22 +28,22 @@ def prepare_input(input_file, start_time, end_time, lang, model_size, use_summar
         gr.Warning(ui_lang["model_dropdown_warning"])
         return [None, None, [None, None]]
-    file_name.input_file = input_file
-    file_name.start_time_for_adjustment = start_time
-    file_name.end_time_for_adjustment = end_time
     print(f"SOURCE: {input_file}")
-    print(f"VIDEO FILE: {file_name.input_file}")
-    print(f"AUDIO FILE: {file_name.audio_file}")
     # Convert video to audio
     progress(0.2, desc=ui_lang["progress_preparing_video"])
     convert_video_to_audio(
-        input_file, file_name.audio_file, start_time, end_time)
     # Start diarization
     progress(0.4, desc=ui_lang["progress_acquiring_diarization"])
-    start_diarization(file_name.audio_file)
     # Start transcribing
     progress(0.6, desc=ui_lang["progress_transcribing_audio"])
@@ -51,16 +51,16 @@ def prepare_input(input_file, start_time, end_time, lang, model_size, use_summar
     # Add subtitle to video
     progress(0.8, desc=ui_lang["progress_add_subtitle"])
-    add_subtitle_to_video(input_file, file_name.subtitle_file,
-                          file_name.video_subtitle_file, start_time, end_time)
     # Return video file link, transcribe string, transcribe.txt, subtitle.txt
     transcribe_txt_list, _ = utils.read_transcribe_subtitle_file(False)
     transcribe_txt = "\n".join(transcribe_txt_list)
     return [
-        file_name.video_subtitle_file,
         transcribe_txt,
-        [file_name.transcribe_file, file_name.subtitle_file]
     ]

 from ui import *
+from file_name import *
 from diarization import start_diarization
 from transcribe import start_transcribe
 from video_tool import convert_video_to_audio, add_subtitle_to_video
 import gradio as gr
 import re
 import os
 import utils
         gr.Warning(ui_lang["model_dropdown_warning"])
         return [None, None, [None, None]]
+    current_input_file = input_file
+    start_time_for_adjustment = start_time
+    end_time_for_adjustment = end_time
     print(f"SOURCE: {input_file}")
+    print(f"VIDEO FILE: {current_input_file}")
+    print(f"AUDIO FILE: {get_audio_file()}")
     # Convert video to audio
     progress(0.2, desc=ui_lang["progress_preparing_video"])
     convert_video_to_audio(
+        input_file, get_audio_file(), start_time, end_time)
     # Start diarization
     progress(0.4, desc=ui_lang["progress_acquiring_diarization"])
+    start_diarization(get_audio_file())
     # Start transcribing
     progress(0.6, desc=ui_lang["progress_transcribing_audio"])
     # Add subtitle to video
     progress(0.8, desc=ui_lang["progress_add_subtitle"])
+    add_subtitle_to_video(input_file, get_subtitle_file,
+                          get_video_subtitle_file, start_time, end_time)
     # Return video file link, transcribe string, transcribe.txt, subtitle.txt
     transcribe_txt_list, _ = utils.read_transcribe_subtitle_file(False)
     transcribe_txt = "\n".join(transcribe_txt_list)
     return [
+        get_video_subtitle_file,
         transcribe_txt,
+        [get_transcribe_file, get_subtitle_file]
     ]

utils.py CHANGED Viewed

@@ -1,26 +1,26 @@
 import json
-import file_name
 import os
 def load_groups_json():
     sample_groups_list = []
     speaker_groups_dict = []
-    if os.path.exists(file_name.sample_groups_json):
-        with open(file_name.sample_groups_json, "r", encoding="utf-8") as json_file_sample:
             sample_groups_list: list = json.load(json_file_sample)
-    if os.path.exists(file_name.speaker_groups_json):
-        with open(file_name.speaker_groups_json, "r", encoding="utf-8") as json_file_speaker:
             speaker_groups_dict: dict = json.load(json_file_speaker)
     return sample_groups_list, speaker_groups_dict
 def write_transcribe_subtitle_file(transcribe_txt_list: list, subtitle_txt_list: list, adjustment: bool):
-    transcribe = file_name.transcribe_file
-    subtitle = file_name.subtitle_file
     if adjustment:
-        transcribe = file_name.transcribe_adjusted_file
-        subtitle = file_name.subtitle_adjusted_file
     with open(transcribe, "w", encoding="utf-8") as file:
         file.writelines(transcribe_txt_list)
@@ -29,11 +29,11 @@ def write_transcribe_subtitle_file(transcribe_txt_list: list, subtitle_txt_list:
 def read_transcribe_subtitle_file(adjustment: bool):
-    transcribe = file_name.transcribe_file
-    subtitle = file_name.subtitle_file
     if adjustment:
-        transcribe = file_name.transcribe_adjusted_file
-        subtitle = file_name.subtitle_adjusted_file
     transcribe_txt_list = []
     subtitle_txt_list = []

 import json
+from file_name import *
 import os
 def load_groups_json():
     sample_groups_list = []
     speaker_groups_dict = []
+    if os.path.exists(sample_groups_json):
+        with open(sample_groups_json, "r", encoding="utf-8") as json_file_sample:
             sample_groups_list: list = json.load(json_file_sample)
+    if os.path.exists(speaker_groups_json):
+        with open(speaker_groups_json, "r", encoding="utf-8") as json_file_speaker:
             speaker_groups_dict: dict = json.load(json_file_speaker)
     return sample_groups_list, speaker_groups_dict
 def write_transcribe_subtitle_file(transcribe_txt_list: list, subtitle_txt_list: list, adjustment: bool):
+    transcribe = get_transcribe_file()
+    subtitle = get_subtitle_file()
     if adjustment:
+        transcribe = get_transcribe_adjusted_file()
+        subtitle = get_subtitle_adjusted_file()
     with open(transcribe, "w", encoding="utf-8") as file:
         file.writelines(transcribe_txt_list)
 def read_transcribe_subtitle_file(adjustment: bool):
+    transcribe = get_transcribe_file()
+    subtitle = get_subtitle_file()
     if adjustment:
+        transcribe = get_transcribe_adjusted_file()
+        subtitle = get_subtitle_adjusted_file()
     transcribe_txt_list = []
     subtitle_txt_list = []

video_tool.py CHANGED Viewed

@@ -4,17 +4,19 @@ import ffmpeg
 def convert_video_to_audio(input_file, output_file, start_time, end_time):
     print(input_file)
     print(output_file)
     (
         ffmpeg
-        .input(input_file, ss=start_time, to=end_time)
-        .output(output_file, format="wav", acodec='pcm_s16le')
         .run(overwrite_output=True)
     )
 def add_subtitle_to_video(input_file, subtitle_file, output_file, start_time, end_time):
     (
         ffmpeg
-        .input(input_file, ss=start_time, to=end_time)
-        .output(output_file, vf='subtitles=' + subtitle_file, preset='ultrafast', acodec='copy')
         .run(overwrite_output=True)
     )

 def convert_video_to_audio(input_file, output_file, start_time, end_time):
     print(input_file)
     print(output_file)
     (
         ffmpeg
+        .input(input_file)
+        .output(output_file, ss=start_time, to=end_time, format="wav", acodec='pcm_s16le')
         .run(overwrite_output=True)
     )
 def add_subtitle_to_video(input_file, subtitle_file, output_file, start_time, end_time):
     (
         ffmpeg
+        .input(input_file)
+        .output(output_file, ss=start_time, to=end_time, vf='subtitles=' + subtitle_file, preset='ultrafast', acodec='copy')
         .run(overwrite_output=True)
     )