Spaces:

Tamerstito
/

translate-audio

Sleeping

App Files Files Community

Tamerstito commited on Apr 7

Commit

c97e116

verified ·

1 Parent(s): f845b65

Update app.py

Browse files

Files changed (1) hide show

app.py +16 -4

app.py CHANGED Viewed

@@ -13,22 +13,32 @@ processor = WhisperProcessor.from_pretrained("openai/whisper-small")
 forced_decoder_ids = processor.get_decoder_prompt_ids(language="es", task="translate")
 # Function to process and translate audio
 def translate_audio(filepath):
     try:
-        if filepath is None:
-            return "No audio file received."
         audio = AudioSegment.from_file(filepath)
         chunk_length_ms = 30 * 1000
         chunks = [audio[i:i + chunk_length_ms] for i in range(0, len(audio), chunk_length_ms)]
         full_translation = ""
         for i, chunk in enumerate(chunks):
             chunk_path = f"chunk_{i}.wav"
             chunk.export(chunk_path, format="wav")
             waveform, sample_rate = torchaudio.load(chunk_path)
             inputs = processor(waveform[0], sampling_rate=sample_rate, return_tensors="pt")
             with torch.no_grad():
@@ -38,17 +48,19 @@ def translate_audio(filepath):
                 )
             translation = processor.batch_decode(generated_ids, skip_special_tokens=True)[0]
             full_translation += translation + " "
             os.remove(chunk_path)
         return full_translation.strip()
     except Exception as e:
-        # Print error for debugging in HF logs
         print("ERROR:", str(e))
         return f"An error occurred: {str(e)}"
 # Gradio UI components
 mic_transcribe = gr.Interface(
     fn=translate_audio,

 forced_decoder_ids = processor.get_decoder_prompt_ids(language="es", task="translate")
 # Function to process and translate audio
+import traceback
 def translate_audio(filepath):
     try:
+        print("Received filepath:", filepath)
+        if filepath is None or not os.path.exists(filepath):
+            return "No audio file received or file does not exist."
         audio = AudioSegment.from_file(filepath)
+        print("Audio loaded. Duration (ms):", len(audio))
         chunk_length_ms = 30 * 1000
         chunks = [audio[i:i + chunk_length_ms] for i in range(0, len(audio), chunk_length_ms)]
+        print(f"Audio split into {len(chunks)} chunks.")
         full_translation = ""
         for i, chunk in enumerate(chunks):
             chunk_path = f"chunk_{i}.wav"
             chunk.export(chunk_path, format="wav")
+            print(f"Exported chunk {i} to {chunk_path}")
             waveform, sample_rate = torchaudio.load(chunk_path)
+            print(f"Loaded chunk {i} with sample rate {sample_rate}")
             inputs = processor(waveform[0], sampling_rate=sample_rate, return_tensors="pt")
             with torch.no_grad():
                 )
             translation = processor.batch_decode(generated_ids, skip_special_tokens=True)[0]
+            print(f"Chunk {i} translation:", translation)
             full_translation += translation + " "
             os.remove(chunk_path)
+        print("Full translation done.")
         return full_translation.strip()
     except Exception as e:
         print("ERROR:", str(e))
+        traceback.print_exc()
         return f"An error occurred: {str(e)}"
 # Gradio UI components
 mic_transcribe = gr.Interface(
     fn=translate_audio,