Spaces:

UcsTurkey
/

flare

Running

App Files Files Community

ciyidogan commited on 18 days ago

Commit

2340c2e

verified ·

1 Parent(s): 9a02b1d

Update state_orchestrator.py

Browse files

Files changed (1) hide show

state_orchestrator.py +36 -31

state_orchestrator.py CHANGED Viewed

@@ -261,39 +261,44 @@ class StateOrchestrator:
             return
         current_state = context.state
         if current_state != ConversationState.LISTENING:
             log_warning(
                 f"⚠️ STT result in unexpected state",
                 session_id=session_id,
-                state=current_state.value  # .value ekledik
             )
             return
-        result_data = event.data
-        is_final = result_data.get("is_final", False)
-        # Sadece final result'ları logla
-        if is_final:
-            text = result_data.get("text", "")
-            log_info(f"💬 Final transcription: '{text}'", session_id=session_id)
-            # Stop STT
-            await self.event_bus.publish(Event(
-                type=EventType.STT_STOPPED,
-                session_id=session_id,
-                data={"reason": "final_result"}
-            ))
-            # Transition to processing
-            await self.transition_to(session_id, ConversationState.PROCESSING_SPEECH)
-            # Send to LLM
-            await self.event_bus.publish(Event(
-                type=EventType.LLM_PROCESSING_STARTED,
-                session_id=session_id,
-                data={"text": text}
-            ))
     async def _handle_llm_response_ready(self, event: Event):
         """Handle LLM response"""
@@ -355,20 +360,20 @@ class StateOrchestrator:
         log_info(f"🎵 Audio playback completed", session_id=session_id, state=current_state.value)
         if current_state in [ConversationState.PLAYING_WELCOME, ConversationState.PLAYING_RESPONSE]:
-            # Transition back to listening
             await self.transition_to(session_id, ConversationState.LISTENING)
-            locale = context.session.locale if hasattr(context.session, 'locale') else 'tr'
-            # Start STT
             await self.event_bus.publish(Event(
                 type=EventType.STT_STARTED,
                 session_id=session_id,
                 data={
                     "locale": locale,
-                    "interim_results": True,
-                    "vad_enabled": True
-                },
             ))
             # Send STT ready signal to frontend

             return
         current_state = context.state
+        result_data = event.data
+        is_final = result_data.get("is_final", False)
+        # Sadece final result'ları işle
+        if not is_final:
+            return
+        text = result_data.get("text", "").strip()
+        if not text:
+            log_warning(f"⚠️ Empty final transcription", session_id=session_id)
+            return
         if current_state != ConversationState.LISTENING:
             log_warning(
                 f"⚠️ STT result in unexpected state",
                 session_id=session_id,
+                state=current_state.value
             )
             return
+        log_info(f"💬 Final transcription: '{text}'", session_id=session_id)
+        # ✅ STT'yi otomatik durdur - single utterance modunda zaten duracak ama emin olmak için
+        await self.event_bus.publish(Event(
+            type=EventType.STT_STOPPED,
+            session_id=session_id,
+            data={"reason": "utterance_completed"}
+        ))
+        # Transition to processing
+        await self.transition_to(session_id, ConversationState.PROCESSING_SPEECH)
+        # Send to LLM
+        await self.event_bus.publish(Event(
+            type=EventType.LLM_PROCESSING_STARTED,
+            session_id=session_id,
+            data={"text": text}
+        ))
     async def _handle_llm_response_ready(self, event: Event):
         """Handle LLM response"""
         log_info(f"🎵 Audio playback completed", session_id=session_id, state=current_state.value)
         if current_state in [ConversationState.PLAYING_WELCOME, ConversationState.PLAYING_RESPONSE]:
+            # Transition to listening
             await self.transition_to(session_id, ConversationState.LISTENING)
+            # ✅ STT'yi başlat - tek konuşma modunda
+            locale = context.metadata.get("locale", "tr")
             await self.event_bus.publish(Event(
                 type=EventType.STT_STARTED,
                 session_id=session_id,
                 data={
                     "locale": locale,
+                    "single_utterance": True,  # ✅ Tek konuşma modu
+                    "interim_results": False,  # ✅ Sadece final
+                    "speech_timeout_ms": 2000  # 2 saniye sessizlik
+                }
             ))
             # Send STT ready signal to frontend