Spaces:

RexChan
/

ISOM5240_Group25

Sleeping

RexChan commited on Mar 25, 2024

Commit

fd326aa

verified ·

1 Parent(s): 91e3ff6

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -8,7 +8,7 @@ from pydub import AudioSegment
 from IPython.display import Audio
 import os
 import accelerate
-import pyaudio
 import numpy as np
 # Create PyAudio object
@@ -18,7 +18,7 @@ SAMPLING_RATE = 16000
 vocals_data = bytes()
 # preprocess and crop audio file
-def audio_preprocess(input_file, in_data, frame_count, time_info, status):
 # Define callback function for audio processing
@@ -32,10 +32,14 @@ def audio_preprocess(input_file, in_data, frame_count, time_info, status):
     # Convert vocals to audio data
     vocals_data = vocals['vocals'].flatten().astype(np.int16).tobytes()
     # Return processed data for output
-    return vocals_data, pyaudio.paContinue
     # Open stream for recording
     stream = p.open(format=pyaudio.paInt16, channels=1, rate=SAMPLING_RATE, input=True, output=True,
                     frames_per_buffer=CHUNK_SIZE, stream_callback=process_audio)
@@ -80,8 +84,6 @@ def audio_preprocess(input_file, in_data, frame_count, time_info, status):
     return processed_audio
 # ASR transcription
 def asr_model(processed_audio):
    # load audio file
@@ -132,7 +134,7 @@ def senti_model(transcription):
 def main(input_file):
-   processed_audio = audio_preprocess(input_file)
    transcription = asr_model(processed_audio)
    final_result = senti_model(transcription)
    st.write(final_result)

 from IPython.display import Audio
 import os
 import accelerate
+#import pyaudio
 import numpy as np
 # Create PyAudio object
 vocals_data = bytes()
 # preprocess and crop audio file
+def audio_preprocess(input_file): #, in_data, frame_count, time_info, status):
 # Define callback function for audio processing
     # Convert vocals to audio data
     vocals_data = vocals['vocals'].flatten().astype(np.int16).tobytes()
+    separated_audio = vocals_data
     # Return processed data for output
+    return vocals_data, pyaudio.paContinue, processed_audio
+# audio processing 2?
+def py_audio():
     # Open stream for recording
     stream = p.open(format=pyaudio.paInt16, channels=1, rate=SAMPLING_RATE, input=True, output=True,
                     frames_per_buffer=CHUNK_SIZE, stream_callback=process_audio)
     return processed_audio
 # ASR transcription
 def asr_model(processed_audio):
    # load audio file
 def main(input_file):
+   separated_audio = audio_preprocess(input_file)
    transcription = asr_model(processed_audio)
    final_result = senti_model(transcription)
    st.write(final_result)