Spaces:

FunAudioLLM
/

InspireMusic

Running on Zero

App Files Files Community

chong.zhang commited on Feb 4

Commit

1343135

1 Parent(s): e58a420

update

Browse files

Files changed (1) hide show

app.py +58 -9

app.py CHANGED Viewed

@@ -32,7 +32,7 @@ def download_model(model_name="InspireMusic-Base"):
 def get_args(
 		task, text="", audio=None, model_name="InspireMusic-Base",
 		chorus="intro", fast=False, fade_out=True, trim=False,
-		output_sample_rate=48000, max_generate_audio_seconds=30.0):
 	# This function constructs the arguments required for InspireMusic
 	args = {
 		"task"                      : task,
@@ -44,13 +44,25 @@ def get_args(
 		"fade_out"                  : fade_out,
 		"trim"                      : trim,
 		"output_sample_rate"        : output_sample_rate,
 		"max_generate_audio_seconds": max_generate_audio_seconds,
 		"model_dir"                 : os.path.join("iic",
 												   model_name),
 		"result_dir"                : "exp/inspiremusic",
 		"output_fn"                 : generate_filename(),
 		"format"                    : "wav",
 	}
 	print(args)
 	return args
@@ -60,23 +72,51 @@ def music_generation(args):
 	model = InspireMusicUnified(
 			model_name=args["model_name"],
 			model_dir=args["model_dir"],
-			fast=args["fast"],
-			fade_out_mode=args["fade_out"],
-			trim=args["trim"],
 			output_sample_rate=args["output_sample_rate"],
-			max_generate_audio_seconds=args["max_generate_audio_seconds"]
-	)
 	output_path = model.inference(
 			task=args["task"],
 			text=args["text"],
 			audio_prompt=args["audio_prompt"],
 			chorus=args["chorus"],
 			output_fn=args["output_fn"],
 			output_format=args["format"],
-			time_start=0.0, time_end=30.0
 	)
 	return output_path
 def run_inspiremusic(task, text, audio, model_name, chorus, fast, fade_out,
 					 trim, output_sample_rate, max_generate_audio_seconds):
@@ -90,7 +130,7 @@ def run_inspiremusic(task, text, audio, model_name, chorus, fast, fade_out,
 with gr.Blocks() as demo:
 	gr.Markdown("""
-    # InspireMusic:
     Generate music using InspireMusic with various tasks such as "Text-to-Music" or "Music Continuation".
     """)
@@ -98,10 +138,19 @@ with gr.Blocks() as demo:
 		task = gr.Radio(["text-to-music", "continuation"], label="Select Task",
 						value="text-to-music")
 		model_name = gr.Dropdown(["InspireMusic-1.5B-Long", "InspireMusic-1.5B", "InspireMusic-1.5B-24kHz", "InspireMusic-Base", "InspireMusic-Base-24kHz"], label="Model Name", value="InspireMusic-Base")
 	text_input = gr.Textbox(label="Input Text (For Text-to-Music Task)")
 	audio_input = gr.Audio(label="Input Audio (For Music Continuation Task)",
 						   type="filepath")
 	with gr.Column():
 		chorus = gr.Dropdown(["verse", "chorus", "intro", "outro"],

 def get_args(
 		task, text="", audio=None, model_name="InspireMusic-Base",
 		chorus="intro", fast=False, fade_out=True, trim=False,
+		output_sample_rate=48000, max_generate_audio_seconds=30.0, time_start = 0.0, time_end=30.0):
 	# This function constructs the arguments required for InspireMusic
 	args = {
 		"task"                      : task,
 		"fade_out"                  : fade_out,
 		"trim"                      : trim,
 		"output_sample_rate"        : output_sample_rate,
+		"min_generate_audio_seconds": 10.0,
 		"max_generate_audio_seconds": max_generate_audio_seconds,
 		"model_dir"                 : os.path.join("iic",
 												   model_name),
 		"result_dir"                : "exp/inspiremusic",
 		"output_fn"                 : generate_filename(),
 		"format"                    : "wav",
+		"time_start" : time_start,
+		"time_end": time_end,
+		"fade_out_duration": 1.0,
 	}
+	if args["time_start"] is None:
+		args["time_start"] = 0.0
+	if args["time_end"] is None:
+		args["time_end"] = args["time_start"] + 30.0
+	if args["time_start"] > args["time_end"]:
+		args["time_end"] = args["time_start"] + 30.0
 	print(args)
 	return args
 	model = InspireMusicUnified(
 			model_name=args["model_name"],
 			model_dir=args["model_dir"],
+			min_generate_audio_seconds=args["min_generate_audio_seconds"],
+			max_generate_audio_seconds=args["max_generate_audio_seconds"],
+			sample_rate=24000,
 			output_sample_rate=args["output_sample_rate"],
+			load_jit=True,
+			load_onnx=False,
+			fast=args["fast"],
+			result_dir=args.result_dir)
 	output_path = model.inference(
 			task=args["task"],
 			text=args["text"],
 			audio_prompt=args["audio_prompt"],
 			chorus=args["chorus"],
+			time_start=args["time_start"],
+			time_end=args["time_end"],
 			output_fn=args["output_fn"],
+			max_audio_prompt_length=args["max_audio_prompt_length"],
+			fade_out_duration=args["fade_out_duration"],
 			output_format=args["format"],
+			fade_out_mode=args["fade_out"],
+			trim=args["trim"])
 	)
 	return output_path
+def update_text():
+    global text_input  # Declare as global to modify the outer scope variable
+    text_input = "New value set by button click"
+    return text_input
+default_prompts = [
+    "Energizing morning melody",
+    "Relaxing evening tune",
+    "Upbeat workout track",
+    "Soothing meditation soundscape",
+    "Joyful dance rhythm"
+]
+def cut_audio(audio_file, cut_seconds=5):
+	audio, sr = torchaudio.load(audio_file)
+	num_samples = cut_seconds * sr
+	cutted_audio = audio[:, :num_samples]
+	output_path = os.path.join(os.getcwd(), "audio_prompt_" + generate_filename() + ".wav")
+	torchaudio.save(output_path, cutted_audio, sr)
+	return output_path
 def run_inspiremusic(task, text, audio, model_name, chorus, fast, fade_out,
 					 trim, output_sample_rate, max_generate_audio_seconds):
 with gr.Blocks() as demo:
 	gr.Markdown("""
+    # InspireMusic
     Generate music using InspireMusic with various tasks such as "Text-to-Music" or "Music Continuation".
     """)
 		task = gr.Radio(["text-to-music", "continuation"], label="Select Task",
 						value="text-to-music")
 		model_name = gr.Dropdown(["InspireMusic-1.5B-Long", "InspireMusic-1.5B", "InspireMusic-1.5B-24kHz", "InspireMusic-Base", "InspireMusic-Base-24kHz"], label="Model Name", value="InspireMusic-Base")
+		# Textbox for custom input
 	text_input = gr.Textbox(label="Input Text (For Text-to-Music Task)")
+	with gr.Row():
+		default_prompt_buttons = []
+		for prompt in default_prompts:
+			button = gr.Button(value=prompt)
+			button.click(fn=update_text, inputs=None, outputs=textbox)
+			default_prompt_buttons.append(button)
 	audio_input = gr.Audio(label="Input Audio (For Music Continuation Task)",
 						   type="filepath")
+	audio_input = cut_audio(audio_input, sr, cut_seconds=5)
 	with gr.Column():
 		chorus = gr.Dropdown(["verse", "chorus", "intro", "outro"],