WhisperSpeech

Runtime error

Tonic commited on Jan 25, 2024

Commit

c2b9474

verified ·

1 Parent(s): 68c37fe

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -37,14 +37,15 @@ def parse_multilingual_text(input_text):
 def generate_segment_audio(text, lang, speaker_url, pipe):
     if not isinstance(text, str):
         text = text.decode("utf-8") if isinstance(text, bytes) else str(text)
-    stoks = pipe.t2s.generate([text], lang=[lang])
-    audio_data = pipe.generate(stoks, speaker_url, lang)
     resample_audio = resampler(newsr=24000)
     audio_data_resampled = next(resample_audio([{'sample_rate': 24000, 'samples': audio_data.cpu()}]))['samples_24k']
     audio_np = audio_data_resampled.cpu().numpy()
     return audio_np
 # Function to concatenate audio segments
 def concatenate_audio_segments(segments):
     concatenated_audio = np.concatenate(segments, axis=0)

 def generate_segment_audio(text, lang, speaker_url, pipe):
     if not isinstance(text, str):
         text = text.decode("utf-8") if isinstance(text, bytes) else str(text)
+    # Generating stoks (tokens<pl>) from text
+    # stoks = pipe.t2s.generate([text], lang=[lang])
+    audio_data = pipe.generate(text, speaker_url, lang)
     resample_audio = resampler(newsr=24000)
     audio_data_resampled = next(resample_audio([{'sample_rate': 24000, 'samples': audio_data.cpu()}]))['samples_24k']
     audio_np = audio_data_resampled.cpu().numpy()
     return audio_np
 # Function to concatenate audio segments
 def concatenate_audio_segments(segments):
     concatenated_audio = np.concatenate(segments, axis=0)