Seed-VC-characters

Running

App Files Files Community

soiz1 commited on Mar 10

Commit

cfa9320

verified ·

1 Parent(s): c9fdce1

Update app.py

Browse files

Files changed (1) hide show

app.py +20 -35

app.py CHANGED Viewed

@@ -337,26 +337,15 @@ def voice_conversion(source, target, diffusion_steps, length_adjust, inference_c
             yield mp3_bytes, None
-examples = [["examples/source/yae_0.wav", "examples/reference/dingzhen_0.wav", 25, 1.0, 0.7, False, True, 0],
-            ["examples/source/jay_0.wav", "examples/reference/azuma_0.wav", 25, 1.0, 0.7, True, True, 0],
-            ["examples/source/Wiz Khalifa,Charlie Puth - See You Again [vocals]_[cut_28sec].wav",
-             "examples/reference/teio_0.wav", 100, 1.0, 0.7, True, False, 0],
-            ["examples/source/TECHNOPOLIS - 2085 [vocals]_[cut_14sec].wav",
-             "examples/reference/trump_0.wav", 50, 1.0, 0.7, True, False, -12],
-            ]
-# 画像とMP3ファイルの情報
-gallery_items = [
-    {"image": "default/sikokumetan.webp", "mp3": "default/sikokumetan.mp3"}
 ]
-# 画像をクリックした時に呼び出す関数
-def set_reference_audio(image_path):
-    # ギャラリーの画像に対応するMP3ファイルを返す
-    for item in gallery_items:
-        if item["image"] == image_path:
             return item["mp3"]
-    return None
 if __name__ == "__main__":
     description = ("Zero-shot音声変換モデル（学習不要）。ローカルでの利用方法は[GitHubリポジトリ](https://github.com/Plachtaa/seed-vc)をご覧ください。"
@@ -366,29 +355,25 @@ if __name__ == "__main__":
     inputs = [
         gr.Audio(type="filepath", label="元音声"),
         gr.Audio(type="filepath", label="参考音声"),
         gr.Slider(minimum=1, maximum=200, value=10, step=1, label="拡散ステップ数", info="デフォルトは10、50～100が最適な品質"),
         gr.Slider(minimum=0.5, maximum=2.0, step=0.1, value=1.0, label="長さ調整", info="1.0未満で速度を上げ、1.0以上で速度を遅くします"),
         gr.Slider(minimum=0.0, maximum=1.0, step=0.1, value=0.7, label="推論CFG率", info="わずかな影響があります"),
         gr.Checkbox(label="F0条件付きモデルを使用", value=False, info="歌声変換には必須です"),
         gr.Checkbox(label="F0自動調整", value=True, info="F0をおおよそ調整して目標音声に合わせます。F0条件付きモデル使用時にのみ有効です"),
         gr.Slider(label='音程変換', minimum=-24, maximum=24, step=1, value=0, info="半音単位の音程変換。F0条件付きモデル使用時にのみ有効です"),
-        gr.Gallery(value=[item["image"] for item in gallery_items], label="画像ギャラリー", interactive=True)
     ]
-    def update_reference_audio(selected_image):
-        # ギャラリーで選択された画像に対応するMP3ファイルを返す
-        mp3_file = set_reference_audio(selected_image)
-        return mp3_file
-    # ギャラリーで選択された画像を参考音声の入力に反映
-    gr.Interface(
-        fn=voice_conversion,
-        description=description,
-        inputs=inputs,
-        outputs=[gr.Audio(label="ストリーム出力音声", streaming=True, format='mp3'),
-                 gr.Audio(label="完全出力音声", streaming=False, format='wav')],
-        title="Seed Voice Conversion",
-        examples=examples,
-        cache_examples=False,
-        live=True
-    ).launch()

             yield mp3_bytes, None
+gallery_data = [
+    {"name": "sikokumetan", "webp": "default/sikokumetan.webp", "mp3": "default/sikokumetan.mp3"}
 ]
+def auto_set_reference(selected_image):
+    for item in gallery_data:
+        if item["webp"] == selected_image:
             return item["mp3"]
+    return ""
 if __name__ == "__main__":
     description = ("Zero-shot音声変換モデル（学習不要）。ローカルでの利用方法は[GitHubリポジトリ](https://github.com/Plachtaa/seed-vc)をご覧ください。"
     inputs = [
         gr.Audio(type="filepath", label="元音声"),
         gr.Audio(type="filepath", label="参考音声"),
+        gr.Gallery(label="ギャラリー", value=[item["webp"] for item in gallery_data],
+                   interactive=True, elem_id="gallery"),
         gr.Slider(minimum=1, maximum=200, value=10, step=1, label="拡散ステップ数", info="デフォルトは10、50～100が最適な品質"),
         gr.Slider(minimum=0.5, maximum=2.0, step=0.1, value=1.0, label="長さ調整", info="1.0未満で速度を上げ、1.0以上で速度を遅くします"),
         gr.Slider(minimum=0.0, maximum=1.0, step=0.1, value=0.7, label="推論CFG率", info="わずかな影響があります"),
         gr.Checkbox(label="F0条件付きモデルを使用", value=False, info="歌声変換には必須です"),
         gr.Checkbox(label="F0自動調整", value=True, info="F0をおおよそ調整して目標音声に合わせます。F0条件付きモデル使用時にのみ有効です"),
         gr.Slider(label='音程変換', minimum=-24, maximum=24, step=1, value=0, info="半音単位の音程変換。F0条件付きモデル使用時にのみ有効です"),
     ]
+    outputs = [
+        gr.Audio(label="ストリーム出力音声", streaming=True, format='mp3'),
+        gr.Audio(label="完全出力音声", streaming=False, format='wav')
+    ]
+    gr.Interface(fn=voice_conversion,
+                 description=description,
+                 inputs=inputs,
+                 outputs=outputs,
+                 title="Seed Voice Conversion",
+                 cache_examples=False,
+                 ).launch()