Spaces:

UcsTurkey
/

flare

Building

App Files Files Community

ciyidogan commited on 13 days ago

Commit

799ddae

verified ·

1 Parent(s): 9ac3f81

Update stt_google.py

Browse files

Files changed (1) hide show

stt_google.py +36 -52

stt_google.py CHANGED Viewed

@@ -202,7 +202,6 @@ class GoogleCloudSTT(STTInterface):
                 """Generate streaming requests"""
                 chunk_count = 0
                 total_bytes = 0
-                first_chunk_processed = False
                 while not self.stop_event.is_set():
                     try:
@@ -214,22 +213,9 @@ class GoogleCloudSTT(STTInterface):
                         chunk_count += 1
                         total_bytes += len(chunk)
-                        # İlk chunk'ta audio format kontrolü
                         if chunk_count == 1:
-                            log_info(f"📤 First chunk - size: {len(chunk)} bytes")
-                            # Audio header kontrolü (WEBM magic bytes)
-                            if len(chunk) >= 4:
-                                if chunk[:4] == b'\x1a\x45\xdf\xa3':
-                                    log_info("✅ Valid WEBM header detected")
-                                    first_chunk_processed = True
-                                else:
-                                    log_error(f"❌ Invalid audio format, first 4 bytes: {chunk[:4].hex()}")
-                                    # Hatalı format, stream'i durdur
-                                    break
-                        # İlk chunk geçerliyse devam et
-                        if chunk_count == 1 and not first_chunk_processed:
-                            break
                         # Her 100 chunk'ta durum raporu
                         if chunk_count % 100 == 0:
@@ -281,51 +267,49 @@ class GoogleCloudSTT(STTInterface):
                     # Response içeriğini kontrol et
                     if not response.results:
                         empty_response_count += 1
-                        if empty_response_count == 1:
-                            log_debug("📭 Received empty response (no results)")
                         continue
-                    for i, result in enumerate(response.results):
-                        log_debug(f"📋 Result {i}: is_final={result.is_final}, alternatives={len(result.alternatives)}")
-                        if not result.alternatives:
-                            log_debug(f"📋 Result {i} has no alternatives")
-                            continue
-                        # İlk alternatifi al
-                        alternative = result.alternatives[0]
-                        # Sadece anlamlı text'leri işle
-                        if alternative.transcript.strip():
-                            # Create transcription result
-                            transcription = TranscriptionResult(
                                 text=alternative.transcript,
                                 is_final=result.is_final,
-                                confidence=alternative.confidence if hasattr(alternative, 'confidence') and alternative.confidence else 0.0,
-                                timestamp=datetime.now().timestamp()
                             )
-                            # Put result in queue
-                            self._put_result(transcription)
-                            # SADECE final result'ları logla
                             if result.is_final:
-                                log_info(f"🎯 GOOGLE STT FINAL: '{alternative.transcript}'")
-                        else:
-                            log_debug(f"📋 Result {i} has empty transcript")
-                            continue
-                if time.time() - last_response_time > RESPONSE_TIMEOUT:
-                    log_error(f"❌ No response from Google STT for {RESPONSE_TIMEOUT} seconds")
                 log_info(f"📊 Google STT stream ended. Total responses: {response_count}, Empty: {empty_response_count}")
-            except Exception as e:
-                error_msg = str(e)
-                # Detaylı hata mesajları
-                if "Exceeded maximum allowed stream duration" in error_msg:
-                    log_warning("⚠️ Stream duration limit exceeded (5 minutes). This is expected for long sessions.")
                 elif "Bad language code" in error_msg:
                     log_error(f"❌ Invalid language code in STT config. Check locale settings.")
                 elif "invalid_argument" in error_msg:

                 """Generate streaming requests"""
                 chunk_count = 0
                 total_bytes = 0
                 while not self.stop_event.is_set():
                     try:
                         chunk_count += 1
                         total_bytes += len(chunk)
+                        # İlk chunk log'u
                         if chunk_count == 1:
+                            log_info(f"📤 First audio chunk to Google STT - size: {len(chunk)} bytes")
                         # Her 100 chunk'ta durum raporu
                         if chunk_count % 100 == 0:
                     # Response içeriğini kontrol et
                     if not response.results:
                         empty_response_count += 1
+                        if empty_response_count % 10 == 0:
+                            log_debug(f"Empty responses received: {empty_response_count}")
                         continue
+                    # Her result'ı işle
+                    for result_index, result in enumerate(response.results):
+                        if result.alternatives:
+                            alternative = result.alternatives[0]
+                            # Sonucu logla (sadece debug modda interim)
+                            if result.is_final or self.debug_mode:
+                                log_debug(f"📋 Result {result_index}: is_final={result.is_final}, alternatives={len(result.alternatives)}")
+                            # TranscriptionResult oluştur ve queue'ya ekle
+                            transcription_result = TranscriptionResult(
                                 text=alternative.transcript,
                                 is_final=result.is_final,
+                                confidence=alternative.confidence if hasattr(alternative, 'confidence') else 0.0
                             )
+                            # Final result'ları her zaman logla
                             if result.is_final:
+                                log_info(f"🎯 GOOGLE STT FINAL: '{transcription_result.text}'")
+                            # Queue'ya ekle
+                            self._put_result(transcription_result)
+                            # Eğer final result ise stream'i durdur
+                            if result.is_final and self.single_utterance:
+                                log_info("🏁 Final result received with single_utterance=True, stopping stream")
+                                self.stop_event.set()
+                                break
                 log_info(f"📊 Google STT stream ended. Total responses: {response_count}, Empty: {empty_response_count}")
+            except grpc.RpcError as e:
+                error_details = e.details() if hasattr(e, 'details') else str(e)
+                error_code = e.code() if hasattr(e, 'code') else None
+                error_msg = f"gRPC error - Code: {error_code}, Details: {error_details}"
+                # Spesifik hata durumlarını kontrol et
+                if "Audio Timeout Error" in error_details or "stream duration" in error_details:
+                    log_info(f"⏱️ Google STT stream timeout after long duration. This is expected for long sessions.")
                 elif "Bad language code" in error_msg:
                     log_error(f"❌ Invalid language code in STT config. Check locale settings.")
                 elif "invalid_argument" in error_msg: