sample_rate: 24000 encoder: idim: 512 odim: 1024 hidden: 256 n_layer: 12 bn_dim: 128 vq: dim: 1024 levels: [5, 5, 5, 5] G: 2 R: 2 decoder: idim: 512 odim: 512 hidden: 256 n_layer: 12 bn_dim: 128