Spaces:

FunAudioLLM
/

InspireMusic

Running on Zero

App Files Files Community

chong.zhang commited on Feb 6

Commit

8ae3c92

1 Parent(s): 6487b24

update

Browse files

Files changed (2) hide show

app.py +6 -18
requirements.txt +1 -1

app.py CHANGED Viewed

@@ -101,7 +101,7 @@ default_prompts = [
 	"Create an emotional, introspective folk song with acoustic guitar and soft vocals."
 ]
-def cut_audio(audio_file, cut_seconds=5):
 	audio, sr = torchaudio.load(audio_file)
 	num_samples = cut_seconds * sr
 	cutted_audio = audio[:, :num_samples]
@@ -109,7 +109,7 @@ def cut_audio(audio_file, cut_seconds=5):
 	torchaudio.save(output_path, cutted_audio, sr)
 	return output_path
-def run_text2music(text, model_name, chorus,
 					 output_sample_rate, max_generate_audio_seconds):
 	args = get_args(
 			task='text-to-music', text=text, audio=None,
@@ -118,10 +118,10 @@ def run_text2music(text, model_name, chorus,
 			max_generate_audio_seconds=max_generate_audio_seconds)
 	return music_generation(args)
-def run_continuation(text, audio, model_name, chorus,
 					 output_sample_rate, max_generate_audio_seconds):
 	args = get_args(
-			task='continuation', text=text, audio=cut_audio(audio, cut_seconds=5),
 			model_name=model_name, chorus=chorus,
 			output_sample_rate=output_sample_rate,
 			max_generate_audio_seconds=max_generate_audio_seconds)
@@ -158,7 +158,7 @@ def main():
 		with gr.Row():
 			button = gr.Button("Text to Music")
-			button.click(run_text2music,
 							  inputs=[text_input, model_name,
 									  chorus,
 									  output_sample_rate,
@@ -166,24 +166,12 @@ def main():
 							  outputs=music_output)
 			generate_button = gr.Button("Music Continuation")
-			generate_button.click(run_continuation,
 							  inputs=[text_input, audio_input, model_name,
 									  chorus,
 									  output_sample_rate,
 									  max_generate_audio_seconds],
 							  outputs=music_output)
-		# with gr.Column():
-		# 	default_prompt_buttons = []
-		# 	for prompt in default_prompts:
-		# 		button = gr.Button(value=prompt)
-		# 		button.click(run_text2music,
-		# 					 inputs=[text_input, model_name,
-		# 							 chorus,
-		# 							 output_sample_rate,
-		# 							 max_generate_audio_seconds],
-		# 					 outputs=music_output)
-		# 		default_prompt_buttons.append(button)
 	demo.launch()
 if __name__ == '__main__':

 	"Create an emotional, introspective folk song with acoustic guitar and soft vocals."
 ]
+def trim_audio(audio_file, cut_seconds=5):
 	audio, sr = torchaudio.load(audio_file)
 	num_samples = cut_seconds * sr
 	cutted_audio = audio[:, :num_samples]
 	torchaudio.save(output_path, cutted_audio, sr)
 	return output_path
+def demo_inspiremusic_t2m(text, model_name, chorus,
 					 output_sample_rate, max_generate_audio_seconds):
 	args = get_args(
 			task='text-to-music', text=text, audio=None,
 			max_generate_audio_seconds=max_generate_audio_seconds)
 	return music_generation(args)
+def demo_inspiremusic_con(text, audio, model_name, chorus,
 					 output_sample_rate, max_generate_audio_seconds):
 	args = get_args(
+			task='continuation', text=text, audio=trim_audio(audio, cut_seconds=5),
 			model_name=model_name, chorus=chorus,
 			output_sample_rate=output_sample_rate,
 			max_generate_audio_seconds=max_generate_audio_seconds)
 		with gr.Row():
 			button = gr.Button("Text to Music")
+			button.click(demo_inspiremusic_t2m,
 							  inputs=[text_input, model_name,
 									  chorus,
 									  output_sample_rate,
 							  outputs=music_output)
 			generate_button = gr.Button("Music Continuation")
+			generate_button.click(demo_inspiremusic_con,
 							  inputs=[text_input, audio_input, model_name,
 									  chorus,
 									  output_sample_rate,
 									  max_generate_audio_seconds],
 							  outputs=music_output)
 	demo.launch()
 if __name__ == '__main__':

requirements.txt CHANGED Viewed

@@ -20,7 +20,7 @@ rich==13.7.1
 soundfile==0.12.1
 tensorboard==2.14.0
 torch==2.0.1
-torchaudio==2.0.2
 uvicorn==0.30.0
 wget==3.2
 WeTextProcessing==1.0.3

 soundfile==0.12.1
 tensorboard==2.14.0
 torch==2.0.1
+torchaudio==2.0.1
 uvicorn==0.30.0
 wget==3.2
 WeTextProcessing==1.0.3