Spaces:

michellelychan
/

bark_voice_clone

Running

michellelychan commited on Sep 4, 2023

Commit

467f7e2

•

1 Parent(s): f5c319c

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -19,9 +19,24 @@ processor = AutoProcessor.from_pretrained("suno/bark")
 voice_preset = "v2/en_speaker_3"
 # generate audio
 def generate_audio(text, preset, output_file_name="bark_generation"):
     file_name = output_file_name + ".wav"
     inputs = processor(text, voice_preset=preset)
     audio_array = model.generate(**inputs)
     audio_array = audio_array.cpu().numpy().squeeze()
     sample_rate = model.generation_config.sample_rate

 voice_preset = "v2/en_speaker_3"
 # generate audio
+# def generate_audio(text, preset, output_file_name="bark_generation"):
+#     file_name = output_file_name + ".wav"
+#     inputs = processor(text, voice_preset=preset)
+#     audio_array = model.generate(**inputs)
+#     audio_array = audio_array.cpu().numpy().squeeze()
+#     sample_rate = model.generation_config.sample_rate
+#     write_wav(file_name, sample_rate, audio_array)
+#     return file_name
 def generate_audio(text, preset, output_file_name="bark_generation"):
     file_name = output_file_name + ".wav"
     inputs = processor(text, voice_preset=preset)
+    # Ensure the inputs are on the right device
+    for k, v in inputs.items():
+        if isinstance(v, torch.Tensor):
+            inputs[k] = v.to(device)
     audio_array = model.generate(**inputs)
     audio_array = audio_array.cpu().numpy().squeeze()
     sample_rate = model.generation_config.sample_rate