Spaces:

Tamerstito
/

translate-audio

Sleeping

Tamerstito commited on Apr 7

Commit

f845b65

verified ·

1 Parent(s): 1d88b62

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -14,35 +14,40 @@ forced_decoder_ids = processor.get_decoder_prompt_ids(language="es", task="trans
 # Function to process and translate audio
 def translate_audio(filepath):
-    if filepath is None:
-        gr.Warning("No audio found, please retry.")
-        return ""
-    audio = AudioSegment.from_file(filepath)
-    chunk_length_ms = 30 * 1000  # 30 seconds
-    chunks = [audio[i:i + chunk_length_ms] for i in range(0, len(audio), chunk_length_ms)]
-    full_translation = ""
-    for i, chunk in enumerate(chunks):
-        chunk_path = f"chunk_{i}.wav"
-        chunk.export(chunk_path, format="wav")
-        waveform, sample_rate = torchaudio.load(chunk_path)
-        inputs = processor(waveform[0], sampling_rate=sample_rate, return_tensors="pt")
-        with torch.no_grad():
-            generated_ids = model.generate(
-                inputs["input_features"],
-                forced_decoder_ids=forced_decoder_ids
-            )
-        translation = processor.batch_decode(generated_ids, skip_special_tokens=True)[0]
-        full_translation += translation + " "
-        os.remove(chunk_path)
-    return full_translation.strip()
 # Gradio UI components
 mic_transcribe = gr.Interface(

 # Function to process and translate audio
 def translate_audio(filepath):
+    try:
+        if filepath is None:
+            return "No audio file received."
+        audio = AudioSegment.from_file(filepath)
+        chunk_length_ms = 30 * 1000
+        chunks = [audio[i:i + chunk_length_ms] for i in range(0, len(audio), chunk_length_ms)]
+        full_translation = ""
+        for i, chunk in enumerate(chunks):
+            chunk_path = f"chunk_{i}.wav"
+            chunk.export(chunk_path, format="wav")
+            waveform, sample_rate = torchaudio.load(chunk_path)
+            inputs = processor(waveform[0], sampling_rate=sample_rate, return_tensors="pt")
+            with torch.no_grad():
+                generated_ids = model.generate(
+                    inputs["input_features"],
+                    forced_decoder_ids=forced_decoder_ids
+                )
+            translation = processor.batch_decode(generated_ids, skip_special_tokens=True)[0]
+            full_translation += translation + " "
+            os.remove(chunk_path)
+        return full_translation.strip()
+    except Exception as e:
+        # Print error for debugging in HF logs
+        print("ERROR:", str(e))
+        return f"An error occurred: {str(e)}"
 # Gradio UI components
 mic_transcribe = gr.Interface(