Spaces:

papercore-dev
/

diff-SVC

Runtime error

diff-SVC / training /config_nsf.yaml

10kwon

DiffSVC

2bfc29a over 2 years ago

3.65 kB

	K_step: 1000
	accumulate_grad_batches: 1
	audio_num_mel_bins: 128
	audio_sample_rate: 44100
	binarization_args:
	shuffle: false
	with_align: true
	with_f0: true
	with_hubert: true
	with_spk_embed: false
	with_wav: false
	binarizer_cls: preprocessing.SVCpre.SVCBinarizer
	binary_data_dir: data/binary/nyaru
	check_val_every_n_epoch: 10
	choose_test_manually: false
	clip_grad_norm: 1
	config_path: training/config_nsf.yaml
	content_cond_steps: []
	cwt_add_f0_loss: false
	cwt_hidden_size: 128
	cwt_layers: 2
	cwt_loss: l1
	cwt_std_scale: 0.8
	datasets:
	- opencpop
	debug: false
	dec_ffn_kernel_size: 9
	dec_layers: 4
	decay_steps: 40000
	decoder_type: fft
	dict_dir: ''
	diff_decoder_type: wavenet
	diff_loss_type: l2
	dilation_cycle_length: 4
	dropout: 0.1
	ds_workers: 4
	dur_enc_hidden_stride_kernel:
	- 0,2,3
	- 0,2,3
	- 0,1,3
	dur_loss: mse
	dur_predictor_kernel: 3
	dur_predictor_layers: 5
	enc_ffn_kernel_size: 9
	enc_layers: 4
	encoder_K: 8
	encoder_type: fft
	endless_ds: false
	f0_bin: 256
	f0_max: 1100.0
	f0_min: 40.0
	ffn_act: gelu
	ffn_padding: SAME
	fft_size: 2048
	fmax: 16000
	fmin: 40
	fs2_ckpt: ''
	gaussian_start: true
	gen_dir_name: ''
	gen_tgt_spk_id: -1
	hidden_size: 256
	hop_size: 512
	hubert_path: checkpoints/hubert/hubert_soft.pt
	hubert_gpu: true
	infer: false
	keep_bins: 128
	lambda_commit: 0.25
	lambda_energy: 0.0
	lambda_f0: 1.0
	lambda_ph_dur: 0.3
	lambda_sent_dur: 1.0
	lambda_uv: 1.0
	lambda_word_dur: 1.0
	load_ckpt: ''
	log_interval: 100
	loud_norm: false
	lr: 0.0008
	max_beta: 0.02
	max_epochs: 3000
	max_eval_sentences: 1
	max_eval_tokens: 60000
	max_frames: 42000
	max_input_tokens: 60000
	max_sentences: 88
	max_tokens: 128000
	max_updates: 1000000
	mel_loss: ssim:0.5\|l1:0.5
	mel_vmax: 1.5
	mel_vmin: -6.0
	min_level_db: -120
	norm_type: gn
	num_ckpt_keep: 10
	num_heads: 2
	num_sanity_val_steps: 1
	num_spk: 1
	num_test_samples: 0
	num_valid_plots: 10
	optimizer_adam_beta1: 0.9
	optimizer_adam_beta2: 0.98
	out_wav_norm: false
	pe_ckpt: checkpoints/0102_xiaoma_pe/model_ckpt_steps_60000.ckpt
	pe_enable: false
	perform_enhance: true
	pitch_ar: false
	pitch_enc_hidden_stride_kernel:
	- 0,2,5
	- 0,2,5
	- 0,2,5
	pitch_extractor: parselmouth
	pitch_loss: l2
	pitch_norm: log
	pitch_type: frame
	pndm_speedup: 10
	pre_align_args:
	allow_no_txt: false
	denoise: false
	forced_align: mfa
	txt_processor: zh_g2pM
	use_sox: true
	use_tone: false
	pre_align_cls: data_gen.singing.pre_align.SingingPreAlign
	predictor_dropout: 0.5
	predictor_grad: 0.1
	predictor_hidden: -1
	predictor_kernel: 5
	predictor_layers: 5
	prenet_dropout: 0.5
	prenet_hidden_size: 256
	pretrain_fs_ckpt: ''
	processed_data_dir: xxx
	profile_infer: false
	raw_data_dir: data/raw/nyaru
	ref_norm_layer: bn
	rel_pos: true
	reset_phone_dict: true
	residual_channels: 384
	residual_layers: 20
	save_best: false
	save_ckpt: true
	save_codes:
	- configs
	- modules
	- src
	- utils
	save_f0: true
	save_gt: false
	schedule_type: linear
	seed: 1234
	sort_by_len: true
	speaker_id: nyaru
	spec_max:
	- 0.0
	spec_min:
	- -5.0
	spk_cond_steps: []
	stop_token_weight: 5.0
	task_cls: training.task.SVC_task.SVCTask
	test_ids: []
	test_input_dir: ''
	test_num: 0
	test_prefixes:
	- test
	test_set_name: test
	timesteps: 1000
	train_set_name: train
	use_crepe: true
	use_denoise: false
	use_energy_embed: false
	use_gt_dur: false
	use_gt_f0: false
	use_midi: false
	use_nsf: true
	use_pitch_embed: true
	use_pos_embed: true
	use_spk_embed: false
	use_spk_id: false
	use_split_spk_id: false
	use_uv: false
	use_vec: false
	use_var_enc: false
	val_check_interval: 2000
	valid_num: 0
	valid_set_name: valid
	vocoder: network.vocoders.nsf_hifigan.NsfHifiGAN
	vocoder_ckpt: checkpoints/nsf_hifigan/model
	warmup_updates: 2000
	wav2spec_eps: 1e-6
	weight_decay: 0
	win_size: 2048
	work_dir: checkpoints/nyaru
	no_fs2: true