musicgen-songstarter-demo

Running

App Files Files Community

Uhhy commited on Sep 15, 2024

Commit

eed21cc

verified ·

1 Parent(s): 43e6802

Update app.py

Browse files

Files changed (1) hide show

app.py +33 -33

app.py CHANGED Viewed

@@ -9,58 +9,58 @@ import uuid
 from torch.cuda.amp import autocast
 import torch
-# Configura o logging
 logging.basicConfig(level=logging.INFO, format='%(asctime)s - %(levelname)s - %(message)s')
-logging.info("Carregando o modelo pré-treinado.")
 model = MusicGen.get_pretrained('nateraw/musicgen-songstarter-v0.2')
-@spaces.GPU(duration=0)
-def generate_music(description, melody_audio, duration):
     with autocast():
-        logging.info("Iniciando a geração de música.")
-        model.set_generation_params(duration=duration)
-        if description:
-            description = [description]
-            if melody_audio:
-                logging.info(f"Carregando a melodia de áudio de: {melody_audio}")
-                melody, sr = torchaudio.load(melody_audio)
-                logging.info("Gerando música com descrição e melodia.")
-                wav = model.generate_with_chroma(description, melody[None], sr)
             else:
-                logging.info("Gerando música apenas com descrição.")
-                wav = model.generate(description)
         else:
-            logging.info("Gerando música de forma incondicional.")
             wav = model.generate_unconditional(1)
         filename = f'{str(uuid.uuid4())}.wav'
-        logging.info(f"Salvando a música gerada com o nome: {filename}")
         path = audio_write(filename, wav[0].cpu().to(torch.float32), model.sample_rate, strategy="loudness", loudness_compressor=True)
-        print("Música salva em", path, ".")
-        # Verifica a forma do tensor de áudio e se foi salvo corretamente
-        logging.info(f"A forma do tensor de áudio gerado: {wav[0].shape}")
-        logging.info("Música gerada e salva com sucesso.")
         if not os.path.exists(path):
-            raise ValueError(f'Failed to save audio to {path}')
         return path
-# Define a interface Gradio
-description = gr.Textbox(label="Description", placeholder="acoustic, guitar, melody, trap, d minor, 90 bpm")
-melody_audio = gr.Audio(label="Melody Audio (optional)", type="filepath")
-duration = gr.Slider(label="Duration (seconds)", minimum=10, maximum=600, step=10, value=30)  # Máximo 10 minutos (600 segundos)
-output_path = gr.Audio(label="Generated Music", type="filepath")
 gr.Interface(
-    fn=generate_music,
-    inputs=[description, melody_audio, duration],
     outputs=output_path,
-    title="MusicGen Demo",
-    description="Generate music using the MusicGen model.",
     examples=[
-        ["trap, synthesizer, songstarters, dark, G# minor, 140 bpm", "./assets/kalhonaho.mp3", 30],
-        ["upbeat, electronic, synth, dance, 120 bpm", None, 60]
     ]
 ).launch()

 from torch.cuda.amp import autocast
 import torch
+# Configura el logging
 logging.basicConfig(level=logging.INFO, format='%(asctime)s - %(levelname)s - %(message)s')
+logging.info("Cargando el modelo preentrenado.")
 model = MusicGen.get_pretrained('nateraw/musicgen-songstarter-v0.2')
+@spaces.GPU(duration=120)
+def generar_musica(descripcion, melodia_audio, duracion):
     with autocast():
+        logging.info("Iniciando la generación de música.")
+        model.set_generation_params(duration=duracion)
+        if descripcion:
+            descripcion = [descripcion]
+            if melodia_audio:
+                logging.info(f"Cargando la melodía de audio desde: {melodia_audio}")
+                melodia, sr = torchaudio.load(melodia_audio)
+                logging.info("Generando música con descripción y melodía.")
+                wav = model.generate_with_chroma(descripcion, melodia[None], sr)
             else:
+                logging.info("Generando música solo con descripción.")
+                wav = model.generate(descripcion)
         else:
+            logging.info("Generando música de manera incondicional.")
             wav = model.generate_unconditional(1)
         filename = f'{str(uuid.uuid4())}.wav'
+        logging.info(f"Guardando la música generada con el nombre: {filename}")
         path = audio_write(filename, wav[0].cpu().to(torch.float32), model.sample_rate, strategy="loudness", loudness_compressor=True)
+        print("Música guardada en", path, ".")
+        # Verifica la forma del tensor de audio generado y si fue guardado correctamente
+        logging.info(f"La forma del tensor de audio generado: {wav[0].shape}")
+        logging.info("Música generada y guardada con éxito.")
         if not os.path.exists(path):
+            raise ValueError(f'No se pudo guardar el audio en {path}')
         return path
+# Definir la interfaz Gradio
+descripcion = gr.Textbox(label="Descripción", placeholder="acústico, guitarra, melodía, trap, re menor, 90 bpm")
+melodia_audio = gr.Audio(label="Melodía de audio (opcional)", type="filepath")
+duracion = gr.Slider(label="Duración (segundos)", minimum=10, maximum=600, step=10, value=30)  # Máximo 10 minutos (600 segundos)
+output_path = gr.Audio(label="Música generada", type="filepath")
 gr.Interface(
+    fn=generar_musica,
+    inputs=[descripcion, melodia_audio, duracion],
     outputs=output_path,
+    title="Generador de Música",
+    description="Genera música utilizando el modelo MusicGen.",
     examples=[
+        ["trap, sintetizador, songstarters, oscuro, G# menor, 140 bpm", "./assets/kalhonaho.mp3", 30],
+        ["alegre, electrónica, sintetizador, dance, 120 bpm", None, 60]
     ]
 ).launch()