{"segments": [[35.0, 38.43]], "p_music": [0.0], "p_speech": [0.0], "labels": ["P(~Music) = 0.0 | P(~Speech) = 0.0"]}