Spaces:

thepatch
/

stable-melodyflow

Running on Zero

App Files Files Community

thecollabagepatch commited on 1 day ago

Commit

026f6aa

1 Parent(s): 11f5aeb

musicgen why not

Browse files

Files changed (1) hide show

app.py +78 -1

app.py CHANGED Viewed

@@ -380,7 +380,42 @@ def transform_with_melodyflow_api(audio_path, prompt, solver="euler", flowstep=0
     except Exception as e:
         return None, f"❌ MelodyFlow API error: {str(e)}"
-def calculate_optimal_bars(bpm):
     """Calculate optimal bar count for given BPM to fit in ~10s"""
     seconds_per_beat = 60.0 / bpm
     seconds_per_bar = seconds_per_beat * 4
@@ -591,6 +626,41 @@ with gr.Blocks(title="stable-melodyflow") as iface:
     transformed_audio = gr.Audio(label="transformed audio", type="filepath")
     transform_status = gr.Textbox(label="status", value="Combine audio first")
     # ========== EVENT HANDLERS ==========
     # Update transform prompt when variation is selected
@@ -627,6 +697,13 @@ with gr.Blocks(title="stable-melodyflow") as iface:
         inputs=[combined_audio, transform_prompt, transform_solver, transform_flowstep],
         outputs=[transformed_audio, transform_status]
     )
 if __name__ == "__main__":
     iface.launch()

     except Exception as e:
         return None, f"❌ MelodyFlow API error: {str(e)}"
+def extend_with_musicgen_api(audio_path, prompt_duration, musicgen_model, output_duration):
+    """Extend audio using the micro-slot-machine space API"""
+    if audio_path is None:
+        return None, "❌ No audio file provided"
+    try:
+        # Initialize client for micro-slot-machine space
+        client = Client("thepatch/micro-slot-machine")
+        print(f"🎼 MusicGen extension:")
+        print(f"   Prompt duration: {prompt_duration}s")
+        print(f"   Model: {musicgen_model}")
+        print(f"   Output duration: {output_duration}s")
+        # Call the continue_music API
+        result = client.predict(
+            input_audio_path=handle_file(audio_path),
+            prompt_duration=str(prompt_duration),
+            musicgen_model=musicgen_model,
+            output_duration=output_duration,
+            api_name="/continue_music"
+        )
+        if result:
+            # Save the result locally
+            output_filename = f"musicgen_extended_{random.randint(1000, 9999)}.wav"
+            import shutil
+            shutil.copy2(result, output_filename)
+            status_msg = f"✅ Extended with {musicgen_model} (prompt: {prompt_duration}s, output: {output_duration}s)"
+            return output_filename, status_msg
+        else:
+            return None, "❌ MusicGen API returned no results"
+    except Exception as e:
+        return None, f"❌ MusicGen API error: {str(e)}"
     """Calculate optimal bar count for given BPM to fit in ~10s"""
     seconds_per_beat = 60.0 / bpm
     seconds_per_bar = seconds_per_beat * 4
     transformed_audio = gr.Audio(label="transformed audio", type="filepath")
     transform_status = gr.Textbox(label="status", value="Combine audio first")
+    # ========== MUSICGEN EXTENSION ==========
+    gr.Markdown("## step four (optional): extend with musicgen")
+    with gr.Row():
+        with gr.Column():
+            musicgen_prompt_duration = gr.Dropdown(
+                label="prompt duration (seconds)",
+                choices=[3, 5, 7, 10],
+                value=5,
+                info="how much of the end to use as prompt for continuation"
+            )
+            musicgen_output_duration = gr.Slider(
+                label="extension duration (seconds)",
+                minimum=10,
+                maximum=30,
+                step=1,
+                value=20,
+                info="how much new audio to generate"
+            )
+        with gr.Column():
+            musicgen_model_choice = gr.Dropdown(
+                label="musicgen model",
+                choices=[
+                    "thepatch/vanya_ai_dnb_0.1 (small)",
+                    "thepatch/bleeps-medium (medium)"
+                ],
+                value="thepatch/vanya_ai_dnb_0.1 (small)",
+                info="drum & bass focused vs experimental bleeps"
+            )
+    extend_btn = gr.Button("extend with musicgen", variant="primary", size="lg")
+    extended_audio = gr.Audio(label="extended audio", type="filepath")
+    extend_status = gr.Textbox(label="status", value="Transform audio first")
     # ========== EVENT HANDLERS ==========
     # Update transform prompt when variation is selected
         inputs=[combined_audio, transform_prompt, transform_solver, transform_flowstep],
         outputs=[transformed_audio, transform_status]
     )
+    # Extend with MusicGen
+    extend_btn.click(
+        extend_with_musicgen_api,
+        inputs=[transformed_audio, musicgen_prompt_duration, musicgen_model_choice, musicgen_output_duration],
+        outputs=[extended_audio, extend_status]
+    )
 if __name__ == "__main__":
     iface.launch()