MoYoYoTech
/

Translator

ONNX

GGUF

conversational

Model card Files Files and versions

xet

Community

david commited on Apr 15

Commit

b2de29e

1 Parent(s): 02e7bde

update coroutine call

Browse files

Files changed (1) hide show

transcribe/whisper_llm_serve.py +10 -5

transcribe/whisper_llm_serve.py CHANGED Viewed

@@ -5,7 +5,7 @@ import threading
 import time
 from logging import getLogger
 from typing import List, Optional, Iterator, Tuple, Any
 import numpy as np
 # import wordninja
 from api_model import TransResult, Message
@@ -40,7 +40,7 @@ class WhisperTranscriptionService(ServeClientBase):
         # 文本分隔符，根据语言设置
         self.text_separator = self._get_text_separator(language)
         # 发送就绪状态
         self.send_ready_state()
         self._transcrible_analysis = None
@@ -50,6 +50,8 @@ class WhisperTranscriptionService(ServeClientBase):
         self.translate_thread = self._start_thread(self._transcription_processing_loop)
         self.frame_processing_thread = self._start_thread(self._frame_processing_loop)
     def _start_thread(self, target_function) -> threading.Thread:
         """启动守护线程执行指定函数"""
@@ -100,9 +102,13 @@ class WhisperTranscriptionService(ServeClientBase):
         """应用语音活动检测来优化音频缓冲区"""
         with self.lock:
             if self.frames_np is not None:
                 frame = self.frames_np.copy()
                 processed_audio = self._translate_pipe.voice_detect(frame.tobytes())
                 self.frames_np = np.frombuffer(processed_audio.audio, dtype=np.float32).copy()
     def _update_audio_buffer(self, offset: int) -> None:
         """从音频缓冲区中移除已处理的部分"""
@@ -204,8 +210,7 @@ class WhisperTranscriptionService(ServeClientBase):
                 time.sleep(0.2)
                 continue
             logger.debug(f"🥤 Buffer Length: {len(audio_buffer)/self.sample_rate:.2f} ")
-            # c+= 1
-            # save_to_wave(f"dev-{c}.wav", audio_buffer)
             # try:
             segments = self._transcribe_audio(audio_buffer)
@@ -255,7 +260,7 @@ class WhisperTranscriptionService(ServeClientBase):
         try:
             message = Message(result=result, request_id=self.client_uid).model_dump_json(by_alias=True)
             coro = self.websocket.send_text(message)
-            asyncio.run(coro)
         except RuntimeError:
             self.stop()
         except Exception as e:

 import time
 from logging import getLogger
 from typing import List, Optional, Iterator, Tuple, Any
+import asyncio
 import numpy as np
 # import wordninja
 from api_model import TransResult, Message
         # 文本分隔符，根据语言设置
         self.text_separator = self._get_text_separator(language)
+        self.loop = asyncio.get_event_loop()
         # 发送就绪状态
         self.send_ready_state()
         self._transcrible_analysis = None
         self.translate_thread = self._start_thread(self._transcription_processing_loop)
         self.frame_processing_thread = self._start_thread(self._frame_processing_loop)
+        # self._c = 0
     def _start_thread(self, target_function) -> threading.Thread:
         """启动守护线程执行指定函数"""
         """应用语音活动检测来优化音频缓冲区"""
         with self.lock:
             if self.frames_np is not None:
+                self._c+= 1
                 frame = self.frames_np.copy()
                 processed_audio = self._translate_pipe.voice_detect(frame.tobytes())
                 self.frames_np = np.frombuffer(processed_audio.audio, dtype=np.float32).copy()
+                # if len(frame) > self.sample_rate:
+                #     save_to_wave(f"{self._c}-org.wav", frame)
+                #     save_to_wave(f"{self._c}-vad.wav", self.frames_np)
     def _update_audio_buffer(self, offset: int) -> None:
         """从音频缓冲区中移除已处理的部分"""
                 time.sleep(0.2)
                 continue
             logger.debug(f"🥤 Buffer Length: {len(audio_buffer)/self.sample_rate:.2f} ")
             # try:
             segments = self._transcribe_audio(audio_buffer)
         try:
             message = Message(result=result, request_id=self.client_uid).model_dump_json(by_alias=True)
             coro = self.websocket.send_text(message)
+            asyncio.run_coroutine_threadsafe(coro, self.loop)
         except RuntimeError:
             self.stop()
         except Exception as e: