Spaces:

UcsTurkey
/

flare

Building

App Files Files Community

ciyidogan commited on 16 days ago

Commit

09d0f4e

verified ·

1 Parent(s): 4c14f2d

Update websocket_handler.py

Browse files

Files changed (1) hide show

websocket_handler.py +17 -13

websocket_handler.py CHANGED Viewed

@@ -470,16 +470,9 @@ async def handle_audio_chunk(websocket: WebSocket, session: RealtimeSession, mes
         # Decode for processing
         decoded_audio = base64.b64decode(audio_data)
-        # DEBUG: Log audio chunk size
-        log_debug(f"🎤 Audio chunk received: {len(decoded_audio)} bytes", session_id=session.session.session_id)
         # Check silence
         silence_duration = session.silence_detector.update(decoded_audio)
-        # DEBUG: Log silence detection
-        if silence_duration > 0:
-            log_debug(f"🔇 Silence detected: {silence_duration}ms", session_id=session.session.session_id)
         # Stream to STT if available
         if session.stt_manager and session.state == ConversationState.LISTENING:
             # Ensure streaming is active
@@ -496,18 +489,25 @@ async def handle_audio_chunk(websocket: WebSocket, session: RealtimeSession, mes
                     return
             try:
-                log_debug(f"🎤 Streaming audio chunk to STT, size: {len(decoded_audio)} bytes", session_id=session.session.session_id)
-                # Her 10. chunk'ta bir test mesajı gönder
                 if not hasattr(session, 'chunk_counter'):
                     session.chunk_counter = 0
                 session.chunk_counter += 1
-                if session.chunk_counter % 10 == 0:
                     log_info(f"📊 Sent {session.chunk_counter} chunks to STT so far...", session_id=session.session.session_id)
                 async for result in session.stt_manager.stream_audio(decoded_audio):
-                    log_info(f"🎉 STT RESULT RECEIVED: {result.text}, final: {result.is_final}", session_id=session.session.session_id)
                     # Send transcription updates
                     await websocket.send_json({
@@ -519,7 +519,7 @@ async def handle_audio_chunk(websocket: WebSocket, session: RealtimeSession, mes
                     if result.is_final:
                         session.current_transcription = result.text
-                        log_info(f"📝 Final transcription: {result.text}", session_id=session.session.session_id)
                         # Final transcription geldiğinde hemen işle
                         if session.current_transcription:
@@ -537,6 +537,10 @@ async def handle_audio_chunk(websocket: WebSocket, session: RealtimeSession, mes
                             # STT'den final result geldiğinde audio buffer'ı ve transcription'ı resetle
                             await session.reset_for_new_utterance()
                             return  # Bu audio chunk için işlem tamamlandı
             except Exception as e:
                 log_error(f"❌ STT streaming error", error=str(e), traceback=traceback.format_exc(), session_id=session.session.session_id)

         # Decode for processing
         decoded_audio = base64.b64decode(audio_data)
         # Check silence
         silence_duration = session.silence_detector.update(decoded_audio)
         # Stream to STT if available
         if session.stt_manager and session.state == ConversationState.LISTENING:
             # Ensure streaming is active
                     return
             try:
+                # Chunk counter - sadece önemli milestone'larda logla
                 if not hasattr(session, 'chunk_counter'):
                     session.chunk_counter = 0
                 session.chunk_counter += 1
+                if session.chunk_counter == 1:
+                    log_info(f"🎤 Started streaming audio to STT", session_id=session.session.session_id)
+                elif session.chunk_counter % 100 == 0:
                     log_info(f"📊 Sent {session.chunk_counter} chunks to STT so far...", session_id=session.session.session_id)
+                # STT'ye gönder ve sonuçları bekle
+                result_received = False
                 async for result in session.stt_manager.stream_audio(decoded_audio):
+                    result_received = True
+                    # Sadece anlamlı sonuçları logla
+                    if result.text.strip():  # Boş olmayan text varsa
+                        log_info(f"🎤 STT: '{result.text}' (final: {result.is_final})", session_id=session.session.session_id)
                     # Send transcription updates
                     await websocket.send_json({
                     if result.is_final:
                         session.current_transcription = result.text
+                        log_info(f"✅ FINAL TRANSCRIPTION: '{result.text}'", session_id=session.session.session_id)
                         # Final transcription geldiğinde hemen işle
                         if session.current_transcription:
                             # STT'den final result geldiğinde audio buffer'ı ve transcription'ı resetle
                             await session.reset_for_new_utterance()
                             return  # Bu audio chunk için işlem tamamlandı
+                # Her 200 chunk'ta bir result gelmiyorsa uyar
+                if not result_received and session.chunk_counter % 200 == 0:
+                    log_warning(f"⚠️ No STT results after {session.chunk_counter} chunks", session_id=session.session.session_id)
             except Exception as e:
                 log_error(f"❌ STT streaming error", error=str(e), traceback=traceback.format_exc(), session_id=session.session.session_id)