Spaces:

tencent
/

SongGeneration

Running on L40S

App Files Files Community

hainazhu commited on Jun 8

Commit

8e684f6

1 Parent(s): b3a289b

prompt audio & advanced cfg

Browse files

Files changed (1) hide show

app.py +44 -9

app.py CHANGED Viewed

@@ -6,6 +6,7 @@ from datetime import datetime
 import os
 import sys
 import librosa
 import os.path as op
 APP_DIR = op.dirname(op.abspath(__file__))
@@ -56,23 +57,35 @@ R&B的节奏奏响.
 # 模拟歌曲生成函数
-def generate_song(description, lyric, prompt_audio=None):
     global model
-    # 这里模拟生成过程 - 实际应用中替换为你的模型调用
     print(f"Generating song with description: {description}")
     print(f"Lyrics provided: {lyric}")
     if prompt_audio is not None:
         print("Using prompt audio for generation")
     sample_rate = model.cfg.sample_rate
-    audio_data = model(lyric, description, op.join(APP_DIR, 'sample/19_2-又是一天过去，烦恼如影随形10s.wav')).cpu().permute(1, 0).float().numpy()
     # 创建输入配置的JSON
     input_config = {
         "description": description,
         "lyric": lyric,
-        "has_prompt_audio": prompt_audio is not None,
         "timestamp": datetime.now().isoformat(),
     }
@@ -108,11 +121,33 @@ with gr.Blocks(title="LeVo Demo Space") as demo:
                         elem_id="audio-prompt"
                     )
                 with gr.Tab("Advanced Config"):
-                    text_prompt = gr.Textbox(
-                    label="Text Prompt",
-                    placeholder="Enter the Text Prompt, eg: emotional piano pop",
                     )
             generate_btn = gr.Button("Generate Song", variant="primary")
         with gr.Column():
@@ -141,7 +176,7 @@ with gr.Blocks(title="LeVo Demo Space") as demo:
     # 生成按钮点击事件
     generate_btn.click(
         fn=generate_song,
-        inputs=[description, lyric, prompt_audio],
         outputs=[output_audio, output_json]
     )

 import os
 import sys
 import librosa
+import time
 import os.path as op
 APP_DIR = op.dirname(op.abspath(__file__))
 # 模拟歌曲生成函数
+def generate_song(description, lyric, prompt_audio=None, cfg_coef=None, temperature=None, top_k=None, progress=gr.Progress(track_tqdm=True)):
     global model
+    params = {'cfg_coef':cfg_coef, 'temperature':temperature, 'top_k':top_k}
+    params = {k:v for k,v in params.items() if v is not None}
+    # 生成过程
     print(f"Generating song with description: {description}")
     print(f"Lyrics provided: {lyric}")
     if prompt_audio is not None:
         print("Using prompt audio for generation")
+    else:
+        prompt_audio = op.join(APP_DIR, 'sample/19_2-又是一天过去，烦恼如影随形10s.wav')
     sample_rate = model.cfg.sample_rate
+    progress(0.0, "Start Generation")
+    start = time.time()
+    audio_data = model(lyric, description, prompt_audio, params).cpu().permute(1, 0).float().numpy()
+    end = time.time()
     # 创建输入配置的JSON
     input_config = {
         "description": description,
         "lyric": lyric,
+        "prompt_audio": prompt_audio,
+        "params": params,
+        "inference_duration": end - start,
         "timestamp": datetime.now().isoformat(),
     }
                         elem_id="audio-prompt"
                     )
                 with gr.Tab("Advanced Config"):
+                    cfg_coef = gr.Slider(
+                        label="CFG Coefficient",
+                        minimum=0.1,
+                        maximum=3.0,
+                        step=0.1,
+                        value=1.5,
+                        interactive=True,
+                        elem_id="cfg-coef",
+                    )
+                    temperature = gr.Slider(
+                        label="Temperature",
+                        minimum=0.1,
+                        maximum=2.0,
+                        step=0.1,
+                        value=1.0,
+                        interactive=True,
+                        elem_id="temperature",
+                    )
+                    top_k = gr.Slider(
+                        label="Top-K",
+                        minimum=1,
+                        maximum=100,
+                        step=1,
+                        value=50,
+                        interactive=True,
+                        elem_id="top_k",
                     )
             generate_btn = gr.Button("Generate Song", variant="primary")
         with gr.Column():
     # 生成按钮点击事件
     generate_btn.click(
         fn=generate_song,
+        inputs=[description, lyric, prompt_audio, cfg_coef, temperature, top_k],
         outputs=[output_audio, output_json]
     )