soiz1 commited on
Commit
03054ef
·
verified ·
1 Parent(s): 886ac42

Update app.py

Browse files
Files changed (1) hide show
  1. app.py +7 -14
app.py CHANGED
@@ -350,29 +350,22 @@ description = ("Zero-shot音声変換モデル(学習不要)。ローカル
350
 
351
  # ギャラリーで選択された音声を `voice_conversion` に渡すプロキシ関数
352
  def proxy_voice_conversion(source, selected_gallery_item, diffusion_steps, length_adjust, inference_cfg_rate, f0_condition, auto_f0_adjust, pitch_shift):
353
- if not source: # sourceがNoneでないかチェック
354
- raise ValueError("音声ファイルが提供されていません。")
355
-
356
- # 画像ファイルと同じ名前のmp3ファイルをソースとして設定
357
- source_filename = os.path.splitext(os.path.basename(source))[0] # 画像ファイル名から拡張子を除く
358
- source_audio = os.path.join(default_dir, f"{source_filename}.mp3")
359
-
360
- if not os.path.isfile(source_audio): # ソース音声ファイルが存在するかチェック
361
- raise ValueError(f"ソース音声ファイルが見つかりません: {source_audio}")
362
 
 
363
  reference_file = os.path.join(default_dir, f"{selected_gallery_item}.mp3")
364
 
365
- if not os.path.isfile(reference_file): # 参照音声ファイルが存在するかチェック
366
  raise ValueError(f"参照音声ファイルが見つかりません: {reference_file}")
367
 
368
- # `voice_conversion` はジェネレーターなのでリスト化して2つの出力を明示的に取得
369
- outputs = list(voice_conversion(source_audio, reference_file, diffusion_steps, length_adjust, inference_cfg_rate, f0_condition, auto_f0_adjust, pitch_shift))
370
 
371
- # 出力数が2つ未満ならエラー回避のため None を補填
372
  while len(outputs) < 2:
373
  outputs.append(None)
374
 
375
- return outputs[0], outputs[1] # 2つのオーディオファイルを返す
 
376
 
377
 
378
  inputs = [
 
350
 
351
  # ギャラリーで選択された音声を `voice_conversion` に渡すプロキシ関数
352
  def proxy_voice_conversion(source, selected_gallery_item, diffusion_steps, length_adjust, inference_cfg_rate, f0_condition, auto_f0_adjust, pitch_shift):
353
+ if not source or not os.path.isfile(source):
354
+ raise ValueError(f"音声ファイルが見つかりません: {source}")
 
 
 
 
 
 
 
355
 
356
+ # ギャラリーで選択された音声のファイルパスを取得
357
  reference_file = os.path.join(default_dir, f"{selected_gallery_item}.mp3")
358
 
359
+ if not os.path.isfile(reference_file):
360
  raise ValueError(f"参照音声ファイルが見つかりません: {reference_file}")
361
 
362
+ outputs = list(voice_conversion(source, reference_file, diffusion_steps, length_adjust, inference_cfg_rate, f0_condition, auto_f0_adjust, pitch_shift))
 
363
 
 
364
  while len(outputs) < 2:
365
  outputs.append(None)
366
 
367
+ return outputs[0], outputs[1]
368
+
369
 
370
 
371
  inputs = [