Seed-VC-characters

Running

App Files Files Community

soiz1 commited on Mar 6

Commit

b8d8ea3

verified ·

1 Parent(s): 2e4ac7b

Update app.py

Browse files

Files changed (1) hide show

app.py +7 -5

app.py CHANGED Viewed

@@ -336,11 +336,9 @@ def voice_conversion(source, target, diffusion_steps, length_adjust, inference_c
             ).export(format="mp3", bitrate=bitrate).read()
             yield mp3_bytes, None
 default_dir = "./default"
 reference_files = [
-    ("四国めたん", "shikokumetan"),
 ]
 gallery_items = [[os.path.join(default_dir, f"{filename}.webp"), name] for name, filename in reference_files]
@@ -350,12 +348,15 @@ description = ("Zero-shot音声変換モデル（学習不要）。ローカル
                "参考音声が25秒を超える場合、自動的に25秒にクリップされます。"
                "また、元音声と参考音声の合計時間が30秒を超える場合、元音声は分割処理されます。")
 def proxy_voice_conversion(source, selected_gallery_item, diffusion_steps, length_adjust, inference_cfg_rate, f0_condition, auto_f0_adjust, pitch_shift):
     if not source or not os.path.isfile(source):
         raise ValueError(f"音声ファイルが見つかりません: {source}")
     if isinstance(selected_gallery_item, list) and len(selected_gallery_item) > 0:
-        selected_gallery_item = selected_gallery_item[0][1]
     else:
         raise ValueError("無効なギャラリー選択項目です。")
@@ -371,6 +372,7 @@ def proxy_voice_conversion(source, selected_gallery_item, diffusion_steps, lengt
     return outputs[0], outputs[1]
 inputs = [
     gr.Audio(type="filepath", label="元音声"),
     gr.Gallery(label="参照音声を選択", value=gallery_items, columns=5, interactive=True),
@@ -394,4 +396,4 @@ gr.Interface(
     outputs=outputs,
     title="Seed Voice Conversion with Reference Gallery",
     cache_examples=False,
-).launch()

             ).export(format="mp3", bitrate=bitrate).read()
             yield mp3_bytes, None
 default_dir = "./default"
 reference_files = [
+    ("四国めたん", "sikokumetan"),
 ]
 gallery_items = [[os.path.join(default_dir, f"{filename}.webp"), name] for name, filename in reference_files]
                "参考音声が25秒を超える場合、自動的に25秒にクリップされます。"
                "また、元音声と参考音声の合計時間が30秒を超える場合、元音声は分割処理されます。")
+# ギャラリーで選択された音声を `voice_conversion` に渡すプロキシ関数
+# ギャラリーで選択されたアイテムから名前を抽出
 def proxy_voice_conversion(source, selected_gallery_item, diffusion_steps, length_adjust, inference_cfg_rate, f0_condition, auto_f0_adjust, pitch_shift):
     if not source or not os.path.isfile(source):
         raise ValueError(f"音声ファイルが見つかりません: {source}")
+    # 選択されたギャラリーアイテムからファイル名を正しく抽出
     if isinstance(selected_gallery_item, list) and len(selected_gallery_item) > 0:
+        selected_gallery_item = selected_gallery_item[0][1]  # 名前部分だけ取り出す
     else:
         raise ValueError("無効なギャラリー選択項目です。")
     return outputs[0], outputs[1]
 inputs = [
     gr.Audio(type="filepath", label="元音声"),
     gr.Gallery(label="参照音声を選択", value=gallery_items, columns=5, interactive=True),
     outputs=outputs,
     title="Seed Voice Conversion with Reference Gallery",
     cache_examples=False,
+).launch()