Seed-VC-characters

Running

soiz1 commited on Mar 2

Commit

3b4e246

verified ·

1 Parent(s): 03054ef

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -349,13 +349,19 @@ description = ("Zero-shot音声変換モデル（学習不要）。ローカル
                "また、元音声と参考音声の合計時間が30秒を超える場合、元音声は分割処理されます。")
 # ギャラリーで選択された音声を `voice_conversion` に渡すプロキシ関数
 def proxy_voice_conversion(source, selected_gallery_item, diffusion_steps, length_adjust, inference_cfg_rate, f0_condition, auto_f0_adjust, pitch_shift):
     if not source or not os.path.isfile(source):
         raise ValueError(f"音声ファイルが見つかりません: {source}")
-    # ギャラリーで選択された音声のファイルパスを取得
     reference_file = os.path.join(default_dir, f"{selected_gallery_item}.mp3")
     if not os.path.isfile(reference_file):
         raise ValueError(f"参照音声ファイルが見つかりません: {reference_file}")
@@ -367,7 +373,6 @@ def proxy_voice_conversion(source, selected_gallery_item, diffusion_steps, lengt
     return outputs[0], outputs[1]
 inputs = [
     gr.Audio(type="filepath", label="元音声"),
     gr.Gallery(label="参照音声を選択", value=gallery_items, columns=5, interactive=True),

                "また、元音声と参考音声の合計時間が30秒を超える場合、元音声は分割処理されます。")
 # ギャラリーで選択された音声を `voice_conversion` に渡すプロキシ関数
+# ギャラリーで選択されたアイテムから名前を抽出
 def proxy_voice_conversion(source, selected_gallery_item, diffusion_steps, length_adjust, inference_cfg_rate, f0_condition, auto_f0_adjust, pitch_shift):
     if not source or not os.path.isfile(source):
         raise ValueError(f"音声ファイルが見つかりません: {source}")
+    # 選択されたギャラリーアイテムからファイル名を正しく抽出
+    if isinstance(selected_gallery_item, list) and len(selected_gallery_item) > 0:
+        selected_gallery_item = selected_gallery_item[0][1]  # 名前部分だけ取り出す
+    else:
+        raise ValueError("無効なギャラリー選択項目です。")
     reference_file = os.path.join(default_dir, f"{selected_gallery_item}.mp3")
     if not os.path.isfile(reference_file):
         raise ValueError(f"参照音声ファイルが見つかりません: {reference_file}")
     return outputs[0], outputs[1]
 inputs = [
     gr.Audio(type="filepath", label="元音声"),
     gr.Gallery(label="参照音声を選択", value=gallery_items, columns=5, interactive=True),