Spaces:

FunAudioLLM
/

InspireMusic

Running on Zero

App Files Files Community

chong.zhang commited on Feb 5

Commit

d896a67

1 Parent(s): 489e7d6

update

Browse files

Files changed (1) hide show

app.py +67 -61

app.py CHANGED Viewed

@@ -6,8 +6,7 @@ import torchaudio
 import datetime
 import hashlib
 import torch
-import importlib
-os.system('nvidia-smi')
 print(torch.backends.cudnn.version())
 def generate_filename():
@@ -126,63 +125,70 @@ def run_continuation(text, audio, model_name, chorus,
 			max_generate_audio_seconds=max_generate_audio_seconds)
 	return music_generation(args)
-with gr.Blocks(theme=gr.themes.Soft()) as demo:
-	gr.Markdown("""
-    # InspireMusic
-    - Support text-to-music, music continuation, audio super-resolution, audio reconstruction tasks with high audio quality, with available sampling rates of 24kHz, 48kHz.
-    - Support long audio generation in multiple output audio formats, i.e., wav, flac, mp3, m4a.
-    - Open-source [InspireMusic-Base](https://modelscope.cn/models/iic/InspireMusic/summary), [InspireMusic-Base-24kHz](https://modelscope.cn/models/iic/InspireMusic-Base-24kHz/summary), [InspireMusic-1.5B](https://modelscope.cn/models/iic/InspireMusic-1.5B/summary), [InspireMusic-1.5B-24kHz](https://modelscope.cn/models/iic/InspireMusic-1.5B-24kHz/summary), [InspireMusic-1.5B-Long](https://modelscope.cn/models/iic/InspireMusic-1.5B-Long/summary) models for music generation.
-    - Currently only support English text prompts.
-    """)
-	with gr.Row(equal_height=True):
-		model_name = gr.Dropdown(["InspireMusic-1.5B-Long", "InspireMusic-1.5B", "InspireMusic-1.5B-24kHz", "InspireMusic-Base", "InspireMusic-Base-24kHz"], label="Select Model Name", value="InspireMusic-Base")
-		chorus = gr.Dropdown(["intro", "verse", "chorus", "outro"],
-							 label="Chorus Mode", value="intro")
-		output_sample_rate = gr.Dropdown([48000, 24000],
-										 label="Output Audio Sample Rate (Hz)",
-										 value=48000)
-		max_generate_audio_seconds = gr.Slider(10, 120,
-											   label="Generate Audio Length (s)",
-											   value=30)
-		# with gr.Column():
-		# 	fast = gr.Checkbox(label="Fast Inference", value=False)
-		# 	fade_out = gr.Checkbox(label="Apply Fade Out Effect", value=True)
-	with gr.Row(equal_height=True):
-		# Textbox for custom input
-		text_input = gr.Textbox(label="Input Text (For Text-to-Music Task)", value="Experience soothing and sensual instrumental jazz with a touch of Bossa Nova, perfect for a relaxing restaurant or spa ambiance.")
-		audio_input = gr.Audio(label="Input Audio Prompt (For Music Continuation Task)",
-							   type="filepath")
-	music_output = gr.Audio(label="Generated Music", type="filepath")
-	with gr.Row():
-		button = gr.Button("Text to Music")
-		button.click(run_text2music,
-						  inputs=[text_input, model_name,
-								  chorus,
-								  output_sample_rate,
-								  max_generate_audio_seconds],
-						  outputs=music_output)
-		generate_button = gr.Button("Music Continuation")
-		generate_button.click(run_continuation,
-						  inputs=[text_input, audio_input, model_name,
-								  chorus,
-								  output_sample_rate,
-								  max_generate_audio_seconds],
-						  outputs=music_output)
-	with gr.Column():
-		default_prompt_buttons = []
-		for prompt in default_prompts:
-			button = gr.Button(value=prompt)
 			button.click(run_text2music,
-						 inputs=[text_input, model_name,
-								 chorus,
-								 output_sample_rate,
-								 max_generate_audio_seconds],
-						 outputs=music_output)
-			default_prompt_buttons.append(button)
-demo.launch()

 import datetime
 import hashlib
 import torch
+from modelscope import snapshot_download
 print(torch.backends.cudnn.version())
 def generate_filename():
 			max_generate_audio_seconds=max_generate_audio_seconds)
 	return music_generation(args)
+def main():
+	with gr.Blocks(theme=gr.themes.Soft()) as demo:
+		gr.Markdown("""
+		# InspireMusic
+		- Support text-to-music, music continuation, audio super-resolution, audio reconstruction tasks with high audio quality, with available sampling rates of 24kHz, 48kHz.
+		- Support long audio generation in multiple output audio formats, i.e., wav, flac, mp3, m4a.
+		- Open-source [InspireMusic-Base](https://modelscope.cn/models/iic/InspireMusic/summary), [InspireMusic-Base-24kHz](https://modelscope.cn/models/iic/InspireMusic-Base-24kHz/summary), [InspireMusic-1.5B](https://modelscope.cn/models/iic/InspireMusic-1.5B/summary), [InspireMusic-1.5B-24kHz](https://modelscope.cn/models/iic/InspireMusic-1.5B-24kHz/summary), [InspireMusic-1.5B-Long](https://modelscope.cn/models/iic/InspireMusic-1.5B-Long/summary) models for music generation.
+		- Currently only support English text prompts.
+		""")
+		with gr.Row(equal_height=True):
+			model_name = gr.Dropdown(["InspireMusic-1.5B-Long", "InspireMusic-1.5B", "InspireMusic-1.5B-24kHz", "InspireMusic-Base", "InspireMusic-Base-24kHz"], label="Select Model Name", value="InspireMusic-Base")
+			chorus = gr.Dropdown(["intro", "verse", "chorus", "outro"],
+								 label="Chorus Mode", value="intro")
+			output_sample_rate = gr.Dropdown([48000, 24000],
+											 label="Output Audio Sample Rate (Hz)",
+											 value=48000)
+			max_generate_audio_seconds = gr.Slider(10, 120,
+												   label="Generate Audio Length (s)",
+												   value=30)
+		with gr.Row(equal_height=True):
+			# Textbox for custom input
+			text_input = gr.Textbox(label="Input Text (For Text-to-Music Task)", value="Experience soothing and sensual instrumental jazz with a touch of Bossa Nova, perfect for a relaxing restaurant or spa ambiance.")
+			audio_input = gr.Audio(label="Input Audio Prompt (For Music Continuation Task)",
+								   type="filepath")
+		music_output = gr.Audio(label="Generated Music", type="filepath")
+		with gr.Row():
+			button = gr.Button("Text to Music")
 			button.click(run_text2music,
+							  inputs=[text_input, model_name,
+									  chorus,
+									  output_sample_rate,
+									  max_generate_audio_seconds],
+							  outputs=music_output)
+			generate_button = gr.Button("Music Continuation")
+			generate_button.click(run_continuation,
+							  inputs=[text_input, audio_input, model_name,
+									  chorus,
+									  output_sample_rate,
+									  max_generate_audio_seconds],
+							  outputs=music_output)
+		with gr.Column():
+			default_prompt_buttons = []
+			for prompt in default_prompts:
+				button = gr.Button(value=prompt)
+				button.click(run_text2music,
+							 inputs=[text_input, model_name,
+									 chorus,
+									 output_sample_rate,
+									 max_generate_audio_seconds],
+							 outputs=music_output)
+				default_prompt_buttons.append(button)
+	demo.launch()
+if __name__ == '__main__':
+	model_list = ["InspireMusic-Base"]
+	for model_name in model_list:
+		if model_name == "InspireMusic-Base":
+			snapshot_download(f"iic/InspireMusic", local_dir=model_dir)
+		else:
+			snapshot_download(f"iic/{model_name}", local_dir=model_dir)os.system('nvidia-smi')
+	main()