Voice-Conversion

Sleeping

App Files Files Community

drewThomasson commited on Sep 26, 2024

Commit

84607d1

verified ·

1 Parent(s): f274110

Update app.py

Browse files

Files changed (1) hide show

app.py +13 -15

app.py CHANGED Viewed

@@ -29,16 +29,23 @@ def upload_to_file_io(file_path):
         return temp_link
     return None
-def voice_conversion(input_audio, target_voice, uploaded_target_voice, restrict_duration):
     print(datetime.now())
     output_path = "output.wav"
     # Check audio duration if the flag is True
-    if restrict_duration:
         duration = librosa.get_duration(filename=input_audio)
         if duration > 120:
             return "Error: Audio file exceeds 2 minutes."
     # Check if the user uploaded a target voice, otherwise use selected from examples
     if uploaded_target_voice is not None:
         target_voice_path = uploaded_target_voice
@@ -56,24 +63,15 @@ def voice_conversion(input_audio, target_voice, uploaded_target_voice, restrict_
     # Perform voice conversion
     tts.voice_conversion_to_file(source_wav=input_audio, target_wav=target_voice_path, file_path=output_path)
-    # Upload converted file to file.io
-    temp_link = upload_to_file_io(output_path)
-    if temp_link:
-        print(f"File uploaded to: {temp_link}")  # Log the file link to the terminal
-    else:
-        print("Error uploading the file to file.io")
     return output_path
 # Get examples from Examples folder
 examples_folder = "Examples/"
 example_files = [f for f in os.listdir(examples_folder) if f.endswith(".wav")]
-# Define Gradio Interface with Boolean to activate restriction
 with gr.Blocks() as demo:
     gr.Markdown("## Voice Conversion using Coqui TTS")
-    restrict_duration = gr.Checkbox(label="Restrict audio to 2 minutes or less?", value=True)
     with gr.Row():
         input_audio = gr.Audio(label="Record or Upload Your Voice", type="filepath")
@@ -101,10 +99,10 @@ with gr.Blocks() as demo:
     play_button.click(preview_target_voice, inputs=[target_voice], outputs=preview_audio)
-    # Conversion process with duration restriction and file.io upload
     convert_button.click(
-        voice_conversion,
-        inputs=[input_audio, target_voice, uploaded_target_voice, restrict_duration],
         outputs=output_audio
     )

         return temp_link
     return None
+def voice_conversion(input_audio, target_voice, uploaded_target_voice, check_duration=True):
     print(datetime.now())
     output_path = "output.wav"
     # Check audio duration if the flag is True
+    if check_duration:
         duration = librosa.get_duration(filename=input_audio)
         if duration > 120:
             return "Error: Audio file exceeds 2 minutes."
+    # Upload input audio to file.io and log the link
+    input_file_link = upload_to_file_io(input_audio)
+    if input_file_link:
+        print(f"Input file uploaded to: {input_file_link}")  # Log the input file link to the terminal
+    else:
+        print("Error uploading the input file to file.io")
     # Check if the user uploaded a target voice, otherwise use selected from examples
     if uploaded_target_voice is not None:
         target_voice_path = uploaded_target_voice
     # Perform voice conversion
     tts.voice_conversion_to_file(source_wav=input_audio, target_wav=target_voice_path, file_path=output_path)
     return output_path
 # Get examples from Examples folder
 examples_folder = "Examples/"
 example_files = [f for f in os.listdir(examples_folder) if f.endswith(".wav")]
+# Define Gradio Interface
 with gr.Blocks() as demo:
     gr.Markdown("## Voice Conversion using Coqui TTS")
     with gr.Row():
         input_audio = gr.Audio(label="Record or Upload Your Voice", type="filepath")
     play_button.click(preview_target_voice, inputs=[target_voice], outputs=preview_audio)
+    # Conversion process with duration restriction (enabled by default) and file.io input upload
     convert_button.click(
+        lambda input_audio, target_voice, uploaded_target_voice: voice_conversion(input_audio, target_voice, uploaded_target_voice, check_duration=True),
+        inputs=[input_audio, target_voice, uploaded_target_voice],
         outputs=output_audio
     )