Seed-VC-characters

Running

App Files Files Community

soiz1 commited on Mar 2

Commit

d0588ba

verified ·

1 Parent(s): 6373eb3

Update app.py

Browse files

Files changed (1) hide show

app.py +4 -6

app.py CHANGED Viewed

@@ -341,7 +341,7 @@ reference_files = [
     ("四国めたん", "sikokumetan"),
 ]
-gallery_items = [os.path.basename(default_dir, f"{filename}.webp") for name, filename in reference_files]
 default_reference = os.path.join(default_dir, f"{reference_files[0][1]}.mp3")
 description = ("Zero-shot音声変換モデル（学習不要）。ローカルでの利用方法は[GitHubリポジトリ](https://github.com/Plachtaa/seed-vc)をご覧ください。"
@@ -349,19 +349,17 @@ description = ("Zero-shot音声変換モデル（学習不要）。ローカル
                "また、元音声と参考音声の合計時間が30秒を超える場合、元音声は分割処理されます。")
 # ギャラリーで選択された音声を `voice_conversion` に渡すプロキシ関数
-# Modify the proxy function to correctly pass the audio file
 def proxy_voice_conversion(source, selected_gallery_item, diffusion_steps, length_adjust, inference_cfg_rate, f0_condition, auto_f0_adjust, pitch_shift):
     reference_file = os.path.join(default_dir, f"{selected_gallery_item}.mp3")
-    # Call the voice conversion function
     outputs = list(voice_conversion(source, reference_file, diffusion_steps, length_adjust, inference_cfg_rate, f0_condition, auto_f0_adjust, pitch_shift))
-    # Ensure we have exactly two outputs
     while len(outputs) < 2:
         outputs.append(None)
-    return outputs[0], outputs[1]  # Return the two audio files
 inputs = [
     gr.Audio(type="filepath", label="元音声"),

     ("四国めたん", "sikokumetan"),
 ]
+gallery_items = [[os.path.join(default_dir, f"{filename}.webp"), name] for name, filename in reference_files]
 default_reference = os.path.join(default_dir, f"{reference_files[0][1]}.mp3")
 description = ("Zero-shot音声変換モデル（学習不要）。ローカルでの利用方法は[GitHubリポジトリ](https://github.com/Plachtaa/seed-vc)をご覧ください。"
                "また、元音声と参考音声の合計時間が30秒を超える場合、元音声は分割処理されます。")
 # ギャラリーで選択された音声を `voice_conversion` に渡すプロキシ関数
 def proxy_voice_conversion(source, selected_gallery_item, diffusion_steps, length_adjust, inference_cfg_rate, f0_condition, auto_f0_adjust, pitch_shift):
     reference_file = os.path.join(default_dir, f"{selected_gallery_item}.mp3")
+    # `voice_conversion` はジェネレーターなのでリスト化して2つの出力を明示的に取得
     outputs = list(voice_conversion(source, reference_file, diffusion_steps, length_adjust, inference_cfg_rate, f0_condition, auto_f0_adjust, pitch_shift))
+    # 出力数が2つ未満ならエラー回避のため None を補填
     while len(outputs) < 2:
         outputs.append(None)
+    return outputs[0], outputs[1]  # 2つのオーディオファイルを返す
 inputs = [
     gr.Audio(type="filepath", label="元音声"),