Spaces:

Tamerstito
/

translate-audio

Sleeping

App Files Files Community

Tamerstito commited on Apr 7

Commit

1d88b62

verified ·

1 Parent(s): 5b45d6b

Update app.py

Browse files

Files changed (1) hide show

app.py +15 -19

app.py CHANGED Viewed

@@ -18,7 +18,6 @@ def translate_audio(filepath):
         gr.Warning("No audio found, please retry.")
         return ""
-    # Load audio using pydub for chunking
     audio = AudioSegment.from_file(filepath)
     chunk_length_ms = 30 * 1000  # 30 seconds
     chunks = [audio[i:i + chunk_length_ms] for i in range(0, len(audio), chunk_length_ms)]
@@ -29,11 +28,9 @@ def translate_audio(filepath):
         chunk_path = f"chunk_{i}.wav"
         chunk.export(chunk_path, format="wav")
-        # Load chunk for model input
         waveform, sample_rate = torchaudio.load(chunk_path)
         inputs = processor(waveform[0], sampling_rate=sample_rate, return_tensors="pt")
-        # Generate translated output
         with torch.no_grad():
             generated_ids = model.generate(
                 inputs["input_features"],
@@ -50,27 +47,26 @@ def translate_audio(filepath):
 # Gradio UI components
 mic_transcribe = gr.Interface(
     fn=translate_audio,
-    inputs=gr.Audio(sources="microphone",
-                    type="filepath"),
-    outputs=gr.Textbox(label="Translation (English to Spanish)",
-                       lines=3),
-    allow_flagging="never")
 file_transcribe = gr.Interface(
     fn=translate_audio,
-    inputs=gr.Audio(sources="upload",
-                    type="filepath"),
-    outputs=gr.Textbox(label="Translation (English to Spanish)",
-                       lines=3),
-    allow_flagging="never",)
 with demo:
     gr.TabbedInterface(
-        [mic_transcribe,
-         file_transcribe],
-        ["Transcribe Microphone",
-         "Transcribe Audio File"],
     )
 server_port = int(os.environ.get("PORT", 7860))
-demo.launch(share=True,
-            server_port=server_port)

         gr.Warning("No audio found, please retry.")
         return ""
     audio = AudioSegment.from_file(filepath)
     chunk_length_ms = 30 * 1000  # 30 seconds
     chunks = [audio[i:i + chunk_length_ms] for i in range(0, len(audio), chunk_length_ms)]
         chunk_path = f"chunk_{i}.wav"
         chunk.export(chunk_path, format="wav")
         waveform, sample_rate = torchaudio.load(chunk_path)
         inputs = processor(waveform[0], sampling_rate=sample_rate, return_tensors="pt")
         with torch.no_grad():
             generated_ids = model.generate(
                 inputs["input_features"],
 # Gradio UI components
 mic_transcribe = gr.Interface(
     fn=translate_audio,
+    inputs=gr.Audio(sources="microphone", type="filepath"),
+    outputs=gr.Textbox(label="Translation (English to Spanish)", lines=3),
+    allow_flagging="never"
+)
 file_transcribe = gr.Interface(
     fn=translate_audio,
+    inputs=gr.Audio(sources="upload", type="filepath"),
+    outputs=gr.Textbox(label="Translation (English to Spanish)", lines=3),
+    allow_flagging="never"
+)
+# Initialize Blocks properly
+demo = gr.Blocks()
 with demo:
     gr.TabbedInterface(
+        [mic_transcribe, file_transcribe],
+        ["Transcribe Microphone", "Transcribe Audio File"]
     )
 server_port = int(os.environ.get("PORT", 7860))
+demo.launch(share=True, server_port=server_port)