Spaces:

fffiloni
/

TIGER-audio-extraction

Running on Zero

App Files Files Community

fffiloni commited on May 22

Commit

d232776

verified ·

1 Parent(s): 9265fd8

add zero gpu decorations and examples

Browse files

Files changed (1) hide show

gradio_app.py +14 -1

gradio_app.py CHANGED Viewed

@@ -5,6 +5,7 @@ import torchaudio
 import torchaudio.transforms as T
 import soundfile as sf
 import gradio as gr
 import look2hear.models
 # Setup device
@@ -21,6 +22,7 @@ TARGET_SR = 16000
 MAX_SPEAKERS = 4
 # --- DnR Function ---
 def separate_dnr(audio_file):
     audio, sr = torchaudio.load(audio_file)
     audio = audio.to(device)
@@ -44,6 +46,7 @@ def separate_dnr(audio_file):
     return dialog_path, effect_path, music_path
 # --- Speaker Separation Function ---
 def separate_speakers(audio_path):
     waveform, original_sr = torchaudio.load(audio_path)
     if original_sr != TARGET_SR:
@@ -80,7 +83,7 @@ def separate_speakers(audio_path):
 # --- Gradio App ---
 with gr.Blocks() as demo:
-    gr.Markdown("# Look2Hear Audio Processing Toolkit")
     with gr.Tabs():
         # --- Tab 1: DnR ---
@@ -90,6 +93,11 @@ with gr.Blocks() as demo:
             dnr_input = gr.Audio(type="filepath", label="Upload Audio File")
             dnr_button = gr.Button("Separate Audio")
             dnr_output_dialog = gr.Audio(label="Dialog", type="filepath")
             dnr_output_effect = gr.Audio(label="Effects", type="filepath")
             dnr_output_music = gr.Audio(label="Music", type="filepath")
@@ -107,6 +115,11 @@ with gr.Blocks() as demo:
             sep_input = gr.Audio(type="filepath", label="Upload Speech Audio")
             sep_button = gr.Button("Separate Speakers")
             gr.Markdown("#### Separated Speakers")
             sep_outputs = []
             for i in range(MAX_SPEAKERS):

 import torchaudio.transforms as T
 import soundfile as sf
 import gradio as gr
+import spaces
 import look2hear.models
 # Setup device
 MAX_SPEAKERS = 4
 # --- DnR Function ---
+@spaces.GPU()
 def separate_dnr(audio_file):
     audio, sr = torchaudio.load(audio_file)
     audio = audio.to(device)
     return dialog_path, effect_path, music_path
 # --- Speaker Separation Function ---
+@spaces.GPU()
 def separate_speakers(audio_path):
     waveform, original_sr = torchaudio.load(audio_path)
     if original_sr != TARGET_SR:
 # --- Gradio App ---
 with gr.Blocks() as demo:
+    gr.Markdown("# TIGER: Time-frequency Interleaved Gain Extraction and Reconstruction for Efficient Speech Separation")
     with gr.Tabs():
         # --- Tab 1: DnR ---
             dnr_input = gr.Audio(type="filepath", label="Upload Audio File")
             dnr_button = gr.Button("Separate Audio")
+            gr.Examples(
+                examples = ["./test/test_mixture_466.wav"],
+                inputs = dnr_input
+            )
             dnr_output_dialog = gr.Audio(label="Dialog", type="filepath")
             dnr_output_effect = gr.Audio(label="Effects", type="filepath")
             dnr_output_music = gr.Audio(label="Music", type="filepath")
             sep_input = gr.Audio(type="filepath", label="Upload Speech Audio")
             sep_button = gr.Button("Separate Speakers")
+            gr.Examples(
+                examples = ["./test/mix.wav"],
+                inputs = sep_input
+            )
             gr.Markdown("#### Separated Speakers")
             sep_outputs = []
             for i in range(MAX_SPEAKERS):