Spaces:

AllAideas
/

speech-to-text

Running

App Files Files Community

cesar commited on Feb 3

Commit

e04c18e

verified ·

1 Parent(s): d2a852e

Update app.py

Browse files

Files changed (1) hide show

app.py +21 -21

app.py CHANGED Viewed

@@ -2,60 +2,60 @@ import io
 import os
 import gradio as gr
 from google.cloud import speech
-rutas = [os.getcwd(),"deploygpt-e9475e7c2c7c.json"]
-os.environ["GOOGLE_APPLICATION_CREDENTIALS"] = '/'.join(rutas)
 def transcribe(file_name):
-    """Transcribe audio bytes to text using Google Cloud Speech to Text."""
     if file_name is None:
         return '', ''
-    # Crea un cliente de Speech to Text
-    client = speech.SpeechClient()
-    # Configura la configuración de la solicitud
     config = speech.RecognitionConfig(
         encoding=speech.RecognitionConfig.AudioEncoding.LINEAR16,
         sample_rate_hertz=44100,
-        #enable_automatic_punctuation=True,
         audio_channel_count=1,
         language_code="es-AR",
-        #model='latest_short',
     )
-    # Crea una solicitud de reconocimiento de audio
     with io.open(file_name, "rb") as audio_file:
         content = audio_file.read()
         audio = speech.RecognitionAudio(content=content)
     # Realiza la transcripción
-    response = client.recognize(request={"config": config, "audio": audio})
     transcript = []
     confidence = []
-    # Reads the response
     for result in response.results:
-        print("Confidence: {}".format(result.alternatives[0].confidence))
         confidence.append(str(result.alternatives[0].confidence))
-        print("Transcript: {}".format(result.alternatives[0].transcript))
         transcript.append(result.alternatives[0].transcript)
     return ' '.join(transcript), '\n'.join(confidence)
 output1 = gr.Textbox(label='Transcripción')
-output2 = gr.Textbox(label='Umbral')
 demo = gr.Interface(
     transcribe,
-    gr.Audio(sources=["microphone"],
-             type="filepath", # Crea un archivo temporal en formato wav
-             label='Grabar audio aquí',
-             streaming=False),
     [output1, output2],
-    title='Demo uso de Speech-to-Text usando la Api de Google',
-    description='<p>Grabar audio para convertir voz a texto.</p>'
 )
 demo.launch()

 import os
 import gradio as gr
 from google.cloud import speech
+from google.api_core.client_options import ClientOptions
+# Obtener la API Key desde las variables de entorno
+API_KEY = os.getenv("GOOGLE_API_KEY")
+# Verificar si la API Key está configurada
+if not API_KEY:
+    raise ValueError("La API Key de Google no está configurada. Configúrala en la variable de entorno GOOGLE_API_KEY.")
 def transcribe(file_name):
+    """Transcribe audio a texto usando Google Cloud Speech-to-Text con API Key."""
     if file_name is None:
         return '', ''
+    # Configurar el cliente de Speech-to-Text con API Key
+    client_options = ClientOptions(api_key=API_KEY)
+    client = speech.SpeechClient(client_options=client_options)
+    # Configuración de la solicitud
     config = speech.RecognitionConfig(
         encoding=speech.RecognitionConfig.AudioEncoding.LINEAR16,
         sample_rate_hertz=44100,
         audio_channel_count=1,
         language_code="es-AR",
     )
+    # Cargar el audio en binario
     with io.open(file_name, "rb") as audio_file:
         content = audio_file.read()
         audio = speech.RecognitionAudio(content=content)
     # Realiza la transcripción
+    response = client.recognize(config=config, audio=audio)
     transcript = []
     confidence = []
+    # Lee la respuesta de la API
     for result in response.results:
         confidence.append(str(result.alternatives[0].confidence))
         transcript.append(result.alternatives[0].transcript)
     return ' '.join(transcript), '\n'.join(confidence)
+# Configuración de la interfaz Gradio
 output1 = gr.Textbox(label='Transcripción')
+output2 = gr.Textbox(label='Confianza')
 demo = gr.Interface(
     transcribe,
+    gr.Audio(sources=["microphone"], type="filepath", label='Grabar audio aquí', streaming=False),
     [output1, output2],
+    title='Demo Speech-to-Text con API Key de Google',
+    description='<p>Grabar audio para convertir voz a texto usando Google Cloud Speech-to-Text.</p>'
 )
 demo.launch()