MoYoYoTech
/

Translator

Model card Files Files and versions

Xin Zhang commited on Apr 23

Commit

70b1d55

·

1 Parent(s): 38a440e

[fix]: opt parameter.

Files changed (2) hide show

transcribe/helpers/funasr.py +1 -1
transcribe/pipelines/pipe_vad.py +3 -3

transcribe/helpers/funasr.py CHANGED Viewed

@@ -24,7 +24,7 @@ class FunASR:
     def warmup(self, warmup_steps=1):
         warmup_soundfile = f"{config.ASSERT_DIR}/jfk.flac"
         for _ in range(warmup_steps):
-            self.model.generate(input=warmup_soundfile)
     def transcribe(self, audio_buffer: bytes, language):
         audio_frames = np.frombuffer(audio_buffer, dtype=np.float32)

     def warmup(self, warmup_steps=1):
         warmup_soundfile = f"{config.ASSERT_DIR}/jfk.flac"
         for _ in range(warmup_steps):
+            self.model.generate(input=warmup_soundfile, disable_pbar=True)
     def transcribe(self, audio_buffer: bytes, language):
         audio_frames = np.frombuffer(audio_buffer, dtype=np.float32)

transcribe/pipelines/pipe_vad.py CHANGED Viewed

@@ -33,12 +33,12 @@ class VadPipe(BasePipe):
     def init(cls):
         if cls.vac is None:
             cls.vac = FixedVADIterator(
-                threshold=0.5,
                 sampling_rate=cls.sample_rate,
                 # speech_pad_ms=10
-                min_silence_duration_ms = 100,
                 # speech_pad_ms = 30,
-                max_speech_duration_s=20.0,
                 )
             cls.vac.reset_states()

     def init(cls):
         if cls.vac is None:
             cls.vac = FixedVADIterator(
+                threshold=0.6,
                 sampling_rate=cls.sample_rate,
                 # speech_pad_ms=10
+                min_silence_duration_ms = 80,
                 # speech_pad_ms = 30,
+                max_speech_duration_s=25.0,
                 )
             cls.vac.reset_states()