Spaces:

chompionsawelo
/

whisper_transcribe

Runtime error

chompionsawelo commited on Aug 10, 2023

Commit

3130060

1 Parent(s): d15328c

transcribe test

Files changed (3) hide show

app.py CHANGED Viewed

@@ -11,7 +11,7 @@ def prepare_input(input_file, progress=gr.Progress()):
     ffmpeg.input(input_file).audio.output(
         output_file, format="wav").run()
     progress(0.4, desc="Acquiring diarization")
-    start_diarization(output_file, progress)
     progress(0.6, desc="Transcribing audio")
     return start_transcribe(progress)

     ffmpeg.input(input_file).audio.output(
         output_file, format="wav").run()
     progress(0.4, desc="Acquiring diarization")
+    start_diarization(output_file)
     progress(0.6, desc="Transcribing audio")
     return start_transcribe(progress)

diarization.py CHANGED Viewed

@@ -12,7 +12,7 @@ device = torch.device("cuda")
 pipeline.to(device)
-def start_diarization(input_file, progress: gr.Progress):
     diarization = pipeline(input_file)
     sample_groups = []

 pipeline.to(device)
+def start_diarization(input_file):
     diarization = pipeline(input_file)
     sample_groups = []

transcribe.py CHANGED Viewed

@@ -15,11 +15,15 @@ def start_transcribe(progress):
         # Transcribe and save temp file
         audiof = f"{speaker}.wav"
         print(f"Loading {audiof}")
-        result = model.transcribe(
             audio=audiof, language='id', word_timestamps=True)
-        with open(f"{speaker}.json", "w") as text_file:
-            json.dump(result, text_file, indent=4)
-        return result['text']
 def load_groups_json():

         # Transcribe and save temp file
         audiof = f"{speaker}.wav"
         print(f"Loading {audiof}")
+        segments, _ = model.transcribe(
             audio=audiof, language='id', word_timestamps=True)
+        segments_list = list(segments)
+        print("SEGMENT LIST: " + str(segments_list))
+        text = segments_list.join(' ')
+        print("TEXT: " + str(text))
+        # with open(f"{speaker}.json", "w") as text_file:
+        #     json.dump(text, text_file, indent=4)
+        # return result['text']
 def load_groups_json():