Seed-VC-characters

Running

App Files Files Community

soiz1 commited on Mar 10

Commit

498dde8

verified ·

1 Parent(s): 6586956

Update app.py

Browse files

Files changed (1) hide show

app.py +47 -49

app.py CHANGED Viewed

@@ -352,55 +352,53 @@ def update_reference_audio(selected_image):
         return image_mp3_mapping[selected_image]["mp3"]
     return None
-if __name__ == "__main__":
     description = ("Zero-shot音声変換モデル（学習不要）。ローカルでの利用方法は[GitHubリポジトリ](https://github.com/Plachtaa/seed-vc)をご覧ください。"
                    "参考音声が25秒を超える場合、自動的に25秒にクリップされます。"
                    "また、元音声と参考音声の合計時間が30秒を超える場合、元音声は分割処理されます。")
-    inputs = [
-        gr.Audio(type="filepath", label="元音声"),
-        gr.Audio(type="filepath", label="参考音声"),
-        gr.Slider(minimum=1, maximum=200, value=10, step=1, label="拡散ステップ数", info="デフォルトは10、50～100が最適な品質"),
-        gr.Slider(minimum=0.5, maximum=2.0, step=0.1, value=1.0, label="長さ調整", info="1.0未満で速度を上げ、1.0以上で速度を遅くします"),
-        gr.Slider(minimum=0.0, maximum=1.0, step=0.1, value=0.7, label="推論CFG率", info="わずかな影響があります"),
-        gr.Checkbox(label="F0条件付きモデルを使用", value=False, info="歌声変換には必須です"),
-        gr.Checkbox(label="F0自動調整", value=True, info="F0をおおよそ調整して目標音声に合わせます。F0条件付きモデル使用時にのみ有効です"),
-        gr.Slider(label='音程変換', minimum=-24, maximum=24, step=1, value=0, info="半音単位の音程変換。F0条件付きモデル使用時にのみ有効です"),
-    ]
-    # ギャラリーとして画像を表示 (画像URLを表示)
-    image_gallery = gr.Radio(
-        label="画像ギャラリー",
-        choices=["sikokumetan"],  # 画像のキーを選択肢として使用
-        type="index",  # 画像のインデックスを選択する形式
-        info="画像を選択してください"
-    )
-    # ギャラリー選択に基づいて参考音声を更新するコンポーネント
-    reference_audio = gr.Audio(type="filepath", label="参考音声")
-    def update_audio(selected_image):
-        selected_mp3 = update_reference_audio(selected_image)
-        return selected_mp3
-    image_gallery.change(fn=update_audio, inputs=image_gallery, outputs=reference_audio)
-    examples = [["examples/source/yae_0.wav", "examples/reference/dingzhen_0.wav", 25, 1.0, 0.7, False, True, 0],
-                ["examples/source/jay_0.wav", "examples/reference/azuma_0.wav", 25, 1.0, 0.7, True, True, 0],
-                ["examples/source/Wiz Khalifa,Charlie Puth - See You Again [vocals]_[cut_28sec].wav",
-                 "examples/reference/teio_0.wav", 100, 1.0, 0.7, True, False, 0],
-                ["examples/source/TECHNOPOLIS - 2085 [vocals]_[cut_14sec].wav",
-                 "examples/reference/trump_0.wav", 50, 1.0, 0.7, True, False, -12],
-                ]
-    outputs = [gr.Audio(label="ストリーム出力音声", streaming=True, format='mp3'),
-               gr.Audio(label="完全出力音声", streaming=False, format='wav')]
-    gr.Interface(fn=voice_conversion,
-                 description=description,
-                 inputs=[*inputs, image_gallery, reference_audio],
-                 outputs=outputs,
-                 title="Seed Voice Conversion",
-                 examples=examples,
-                 cache_examples=False,
-                 ).launch()

         return image_mp3_mapping[selected_image]["mp3"]
     return None
+# Blocksコンテキストを使用してUIを作成
+with gr.Blocks() as demo:
     description = ("Zero-shot音声変換モデル（学習不要）。ローカルでの利用方法は[GitHubリポジトリ](https://github.com/Plachtaa/seed-vc)をご覧ください。"
                    "参考音声が25秒を超える場合、自動的に25秒にクリップされます。"
                    "また、元音声と参考音声の合計時間が30秒を超える場合、元音声は分割処理されます。")
+    with gr.Column():
+        inputs = [
+            gr.Audio(type="filepath", label="元音声"),
+            gr.Audio(type="filepath", label="参考音声"),
+            gr.Slider(minimum=1, maximum=200, value=10, step=1, label="拡散ステップ数", info="デフォルトは10、50～100が最適な品質"),
+            gr.Slider(minimum=0.5, maximum=2.0, step=0.1, value=1.0, label="長さ調整", info="1.0未満で速度を上げ、1.0以上で速度を遅くします"),
+            gr.Slider(minimum=0.0, maximum=1.0, step=0.1, value=0.7, label="推論CFG率", info="わずかな影響があります"),
+            gr.Checkbox(label="F0条件付きモデルを使用", value=False, info="歌声変換には必須です"),
+            gr.Checkbox(label="F0自動調整", value=True, info="F0をおおよそ調整して目標音声に合わせます。F0条件付きモデル使用時にのみ有効です"),
+            gr.Slider(label='音程変換', minimum=-24, maximum=24, step=1, value=0, info="半音単位の音程変換。F0条件付きモデル使用時にのみ有効です"),
+        ]
+        # ギャラリーとして画像を表示 (画像URLを表示)
+        image_gallery = gr.Radio(
+            label="画像ギャラリー",
+            choices=["sikokumetan"],  # 画像のキーを選択肢として使用
+            type="index",  # 画像のインデックスを選択する形式
+            info="画像を選択してください"
+        )
+        # ギャラリー選択に基づいて参考音声を更新するコンポーネント
+        reference_audio = gr.Audio(type="filepath", label="参考音声")
+        # ギャラリー選択に基づいて参考音声を更新する関数
+        def update_audio(selected_image):
+            selected_mp3 = update_reference_audio(selected_image)
+            return selected_mp3
+        # 画像選択の変更イベントに反応
+        image_gallery.change(fn=update_audio, inputs=image_gallery, outputs=reference_audio)
+        examples = [["examples/source/yae_0.wav", "examples/reference/dingzhen_0.wav", 25, 1.0, 0.7, False, True, 0],
+                    ["examples/source/jay_0.wav", "examples/reference/azuma_0.wav", 25, 1.0, 0.7, True, True, 0],
+                    ["examples/source/Wiz Khalifa,Charlie Puth - See You Again [vocals]_[cut_28sec].wav",
+                     "examples/reference/teio_0.wav", 100, 1.0, 0.7, True, False, 0],
+                    ["examples/source/TECHNOPOLIS - 2085 [vocals]_[cut_14sec].wav",
+                     "examples/reference/trump_0.wav", 50, 1.0, 0.7, True, False, -12],
+                    ]
+        outputs = [gr.Audio(label="ストリーム出力音声", streaming=True, format='mp3'),
+                   gr.Audio(label="完全出力音声", streaming=False, format='wav')]
+    # インターフェースを起動
+    demo.launch()