Spaces:

PlayHT
/

PlayDiffusion

Running on L40S

yavorr commited on Jun 10

Commit

48324cb

1 Parent(s): 6b64247

Add Voice Conversion support to gradio

Files changed (1) hide show

app.py CHANGED Viewed

@@ -3,10 +3,7 @@ import os
 import gradio as gr
 from openai import OpenAI
-from playdiffusion import PlayDiffusion, InpaintInput, TTSInput
-from playdiffusion.utils.audio_utils import raw_audio_to_torch_audio
-from playdiffusion.utils.save_audio import make_16bit_pcm
-from playdiffusion.utils.voice_resource import VoiceResource
 whisper_client = OpenAI(api_key=os.getenv("OPENAI_API_KEY"))
 inpainter = PlayDiffusion()
@@ -72,6 +69,9 @@ def create_advanced_options_accordion():
             use_manual_ratio, audio_token_syllable_ratio)
 if __name__ == '__main__':
     with gr.Blocks(analytics_enabled=False, title="PlayDiffusion") as demo:
         gr.Markdown("## PlayDiffusion")
@@ -126,4 +126,21 @@ if __name__ == '__main__':
                 outputs=[tts_output]
             )
     demo.launch(share=True)

 import gradio as gr
 from openai import OpenAI
+from playdiffusion import PlayDiffusion, InpaintInput, TTSInput, RVCInput
 whisper_client = OpenAI(api_key=os.getenv("OPENAI_API_KEY"))
 inpainter = PlayDiffusion()
             use_manual_ratio, audio_token_syllable_ratio)
+def speech_rvc(rvc_source_speech, rvc_target_voice):
+    return inpainter.rvc(RVCInput(source_speech=rvc_source_speech, target_voice=rvc_target_voice))
 if __name__ == '__main__':
     with gr.Blocks(analytics_enabled=False, title="PlayDiffusion") as demo:
         gr.Markdown("## PlayDiffusion")
                 outputs=[tts_output]
             )
+        with gr.Tab("Voice Conversion"):
+            gr.Markdown("### Real Time Voice Conversion (works best for english)")
+            rvc_source_speech =  gr.Audio(label="Source Conversion Speech",
+                sources=["upload", "microphone"], type="filepath",
+            )
+            rvc_target_voice =  gr.Audio(label="Target Voice",
+                sources=["upload", "microphone"], type="filepath",
+            )
+            rvc_submit = gr.Button("Real time Voice Conversion")
+            rvc_output = gr.Audio(label="Converted Speech")
+            rvc_submit.click(
+                speech_rvc,
+                inputs=[rvc_source_speech, rvc_target_voice],
+                outputs=[rvc_output]
+            )
     demo.launch(share=True)