Spaces:

fffiloni
/

instant-TTS-Bark-cloning

Paused

Update app.py

ac4deb7 over 1 year ago

1.01 kB

	import gradio as gr



	from huggingface_hub import snapshot_download




	model_ids = [
	'suno/bark',
	]
	for model_id in model_ids:
	model_name = model_id.split('/')[-1]
	snapshot_download(model_id, local_dir=f'checkpoints/{model_name}')



	from TTS.tts.configs.bark_config import BarkConfig
	from TTS.tts.models.bark import Bark

	config = BarkConfig()
	model = Bark.init_from_config(config)
	model.load_checkpoint(config, checkpoint_dir="checkpoints/bark", eval=True)

	def infer(prompt):

	text = "Hello, my name is Manmay , how are you?"

	# with random speaker
	#output_dict = model.synthesize(text, config, speaker_id="random", voice_dirs=None)

	# cloning a speaker.
	# It assumes that you have a speaker file in `bark_voices/speaker_n/speaker.wav` or `bark_voices/speaker_n/speaker.npz`
	output_dict = model.synthesize(text, config, speaker_id="speaker", voice_dirs="bark_voices/")

	return "done"

	gr.Interface(fn=infer, inputs=[gr.Textbox()], outputs=[gr.Textbox()]).launch()