Spaces:

UcsTurkey
/

flare

Running

App Files Files Community

ciyidogan commited on Jul 11

Commit

931d646

verified ·

1 Parent(s): 5ab11dd

Update stt/stt_lifecycle_manager.py

Browse files

Files changed (1) hide show

stt/stt_lifecycle_manager.py +19 -14

stt/stt_lifecycle_manager.py CHANGED Viewed

@@ -131,34 +131,39 @@ class STTLifecycleManager:
     async def _handle_audio_chunk(self, event: Event):
         """Process audio chunk through VAD and collect"""
         session_id = event.session_id
         stt_session = self.stt_sessions.get(session_id)
         if not stt_session or not stt_session.is_active:
             return
         try:
             # Decode audio data
             audio_data = base64.b64decode(event.data.get("audio_data", ""))
             # Add to buffer
             stt_session.audio_buffer.append(audio_data)
             stt_session.total_chunks += 1
             stt_session.total_bytes += len(audio_data)
             # Process through VAD
             is_speech, silence_duration_ms = stt_session.vad.process_chunk(audio_data)
             # Check if utterance ended (silence threshold reached)
             if not is_speech and silence_duration_ms >= 2000:  # 2 seconds of silence
                 log_info(f"💬 Utterance ended after {silence_duration_ms}ms silence", session_id=session_id)
-                # Stop STT to trigger transcription
-                await self.event_bus.publish(Event(
-                    type=EventType.STT_STOPPED,
-                    session_id=session_id,
-                    data={"reason": "silence_detected"}
-                ))
             # Log progress periodically
             if stt_session.total_chunks % 100 == 0:
                 log_debug(
@@ -168,14 +173,14 @@ class STTLifecycleManager:
                     bytes=stt_session.total_bytes,
                     vad_stats=stt_session.vad.get_stats()
                 )
         except Exception as e:
             log_error(
                 f"❌ Error processing audio chunk",
                 session_id=session_id,
                 error=str(e)
             )
     async def _handle_session_ended(self, event: Event):
         """Clean up STT resources when session ends"""
         session_id = event.session_id

     async def _handle_audio_chunk(self, event: Event):
         """Process audio chunk through VAD and collect"""
         session_id = event.session_id
         stt_session = self.stt_sessions.get(session_id)
         if not stt_session or not stt_session.is_active:
+            # ✅ STT aktif değilse chunk'ları ignore et
             return
         try:
             # Decode audio data
             audio_data = base64.b64decode(event.data.get("audio_data", ""))
             # Add to buffer
             stt_session.audio_buffer.append(audio_data)
             stt_session.total_chunks += 1
             stt_session.total_bytes += len(audio_data)
             # Process through VAD
             is_speech, silence_duration_ms = stt_session.vad.process_chunk(audio_data)
             # Check if utterance ended (silence threshold reached)
             if not is_speech and silence_duration_ms >= 2000:  # 2 seconds of silence
                 log_info(f"💬 Utterance ended after {silence_duration_ms}ms silence", session_id=session_id)
+                # ✅ STT'yi sadece aktifse durdur
+                if stt_session.is_active:
+                    stt_session.is_active = False  # ✅ Hemen inaktif yap, tekrar trigger olmasın
+                    # Stop STT to trigger transcription
+                    await self.event_bus.publish(Event(
+                        type=EventType.STT_STOPPED,
+                        session_id=session_id,
+                        data={"reason": "silence_detected"}
+                    ))
             # Log progress periodically
             if stt_session.total_chunks % 100 == 0:
                 log_debug(
                     bytes=stt_session.total_bytes,
                     vad_stats=stt_session.vad.get_stats()
                 )
         except Exception as e:
             log_error(
                 f"❌ Error processing audio chunk",
                 session_id=session_id,
                 error=str(e)
             )
     async def _handle_session_ended(self, event: Event):
         """Clean up STT resources when session ends"""
         session_id = event.session_id