Spaces:

UcsTurkey
/

flare

Building

App Files Files Community

ciyidogan commited on 15 days ago

Commit

3ab9a0b

verified ·

1 Parent(s): fd94fce

Update stt/stt_google.py

Browse files

Files changed (1) hide show

stt/stt_google.py +11 -13

stt/stt_google.py CHANGED Viewed

@@ -343,30 +343,28 @@ class GoogleCloudSTT(STTInterface):
             self.client = speech.SpeechClient()
             log_info("✅ Created new Google Speech client")
-            # Create recognition config
-            recognition_config = speech.RecognitionConfig(
                 encoding=self._get_encoding(config.encoding),
                 sample_rate_hertz=config.sample_rate,
                 language_code=config.language,
                 enable_automatic_punctuation=config.enable_punctuation,
-                model=config.model,
-                use_enhanced=config.use_enhanced,
-                max_alternatives=1,
-                metadata=speech.RecognitionMetadata(
-                    interaction_type=speech.RecognitionMetadata.InteractionType.VOICE_SEARCH,
-                    microphone_distance=speech.RecognitionMetadata.MicrophoneDistance.NEARFIELD,
-                    recording_device_type=speech.RecognitionMetadata.RecordingDeviceType.PC,
-                )
             )
-            # Create streaming config with VAD
             self.streaming_config = speech.StreamingRecognitionConfig(
                 config=recognition_config,
                 interim_results=config.interim_results,
-                single_utterance=config.single_utterance,
-                enable_voice_activity_events=True  # ✅ VAD events enabled
             )
             log_info(f"📋 Streaming config created: interim_results={config.interim_results}, "
                      f"single_utterance={config.single_utterance}, "
                      f"VAD_events=True")

             self.client = speech.SpeechClient()
             log_info("✅ Created new Google Speech client")
+           recognition_config = speech.RecognitionConfig(
                 encoding=self._get_encoding(config.encoding),
                 sample_rate_hertz=config.sample_rate,
                 language_code=config.language,
                 enable_automatic_punctuation=config.enable_punctuation,
+                model="latest_long",
+                use_enhanced=True
             )
             self.streaming_config = speech.StreamingRecognitionConfig(
                 config=recognition_config,
                 interim_results=config.interim_results,
+                single_utterance=config.single_utterance
             )
+            self.is_streaming = True
+            self.stop_event.clear()
+            # Start streaming thread
+            self.stream_thread = threading.Thread(target=self._run_stream)
+            self.stream_thread.start()
             log_info(f"📋 Streaming config created: interim_results={config.interim_results}, "
                      f"single_utterance={config.single_utterance}, "
                      f"VAD_events=True")