Spaces:

Justtalk
/

JusTalk

Running

App Files Files Community

rein0421 commited on Apr 20

Commit

e5e61c7

verified ·

1 Parent(s): 1b7bec8

Update app.py

Browse files

Files changed (1) hide show

app.py +153 -48

app.py CHANGED Viewed

@@ -278,77 +278,182 @@ def update_all_users():
 @app.route('/upload_audio', methods=['POST'])
 def upload_audio():
     global total_audio
-    global users
     try:
         data = request.get_json()
         if not data or 'audio_data' not in data:
             return jsonify({"error": "音声データがありません"}), 400
-        # リクエストからユーザーリストを取得（指定がなければ現在のusersを使用）
-        if 'selected_users' in data and data['selected_users']:
-            users = data['selected_users']
-            print(f"選択されたユーザー: {users}")
-        if not users:
             return jsonify({"error": "選択されたユーザーがいません"}), 400
         # Base64デコードして音声バイナリを取得
         audio_binary = base64.b64decode(data['audio_data'])
-        upload_name = 'tmp'
-        audio_dir = "/tmp/data"
         os.makedirs(audio_dir, exist_ok=True)
         audio_path = os.path.join(audio_dir, f"{upload_name}.wav")
         with open(audio_path, 'wb') as f:
             f.write(audio_binary)
-        print(f"処理を行うユーザー: {users}")
-        # ベース音声を一時ディレクトリにダウンロード
-        temp_dir = "/tmp/data/base_audio"
-        os.makedirs(temp_dir, exist_ok=True)
         # 各ユーザーの参照音声ファイルのパスをリストに格納
         reference_paths = []
-        for user in users:
             try:
-                ref_path = os.path.join(temp_dir, f"{user}.wav")
-                if not os.path.exists(ref_path):
-                    # クラウドから取得
-                    download_from_cloud(f"{user}.wav", ref_path)
-                    print(f"クラウドから {user}.wav をダウンロードしました")
                 if not os.path.exists(ref_path):
-                    return jsonify({"error": "参照音声ファイルが見つかりません", "details": ref_path}), 500
-                reference_paths.append(ref_path)
             except Exception as e:
-                return jsonify({"error": f"ユーザー {user} の音声取得に失敗しました", "details": str(e)}), 500
-        # 複数人の場合は参照パスのリストを、1人の場合は単一のパスを渡す
-        if len(users) > 1:
-            print("複数人の場合の処理")
-            matched_times, merged_segments = process.process_multi_audio(reference_paths, audio_path, users, threshold=0.05)
-            total_audio = transcripter.save_marged_segments(merged_segments)
             # 各メンバーのrateを計算
-            total_time = sum(matched_times)
-            rates = [(time / total_time) * 100 if total_time > 0 else 0 for time in matched_times]
-            # ユーザー名と話した割合をマッピング
-            user_rates = {users[i]: rates[i] for i in range(len(users))}
-            return jsonify({"rates": rates, "user_rates": user_rates}), 200
         else:
-            matched_time, unmatched_time, merged_segments = process.process_audio(reference_paths[0], audio_path, users[0], threshold=0.05)
-            total_audio = transcripter.save_marged_segments(merged_segments)
-            print("単一ユーザーの処理")
             total_time = matched_time + unmatched_time
             rate = (matched_time / total_time) * 100 if total_time > 0 else 0
-            return jsonify({"rate": rate, "user": users[0]}), 200
     except Exception as e:
-        print("Error in /upload_audio:", str(e))
-        return jsonify({"error": "サーバーエラー", "details": str(e)}), 500
 # ユーザー選択画面（テンプレート: userSelect.html）
 @app.route('/')

 @app.route('/upload_audio', methods=['POST'])
 def upload_audio():
     global total_audio
+    global users # グローバル変数のusersを更新する場合
     try:
         data = request.get_json()
         if not data or 'audio_data' not in data:
+            print("エラー: リクエストに audio_data が含まれていません。")
             return jsonify({"error": "音声データがありません"}), 400
+        # リクエストからユーザーリストを取得（指定がなければ現在のusersを使用）
+        # リクエストごとにユーザーを指定する方が安全
+        request_users = data.get('selected_users', []) # .getでキーが存在しない場合も安全に
+        if request_users:
+            current_users = request_users # リクエストで指定されたユーザーを使用
+            print(f"リクエストから選択されたユーザー: {current_users}")
+        else:
+            # グローバル変数を使う場合（非推奨）
+            # current_users = users
+            # print(f"グローバル変数からユーザーを使用: {current_users}")
+            # グローバル変数ではなく、エラーにする方が安全
+             print("エラー: リクエストに selected_users が指定されていません。")
+             return jsonify({"error": "選択されたユーザーが指定されていません"}), 400
+        if not current_users:
+            print("エラー: 処理対象のユーザーがいません。")
             return jsonify({"error": "選択されたユーザーがいません"}), 400
         # Base64デコードして音声バイナリを取得
         audio_binary = base64.b64decode(data['audio_data'])
+        # 一時ファイルに音声を保存
+        upload_name = 'uploaded_audio_segment' # 一時ファイル名
+        audio_dir = "/tmp/justalk_audio_data" # 一時ディレクトリ名（環境に合わせて変更可）
         os.makedirs(audio_dir, exist_ok=True)
         audio_path = os.path.join(audio_dir, f"{upload_name}.wav")
         with open(audio_path, 'wb') as f:
             f.write(audio_binary)
+        print(f"一時音声ファイルを保存: {audio_path}")
+        print(f"処理を実行するユーザー: {current_users}")
+        # 参照音声用の一時ディレクトリ
+        temp_ref_dir = os.path.join(audio_dir, "base_audio")
+        os.makedirs(temp_ref_dir, exist_ok=True)
         # 各ユーザーの参照音声ファイルのパスをリストに格納
         reference_paths = []
+        missing_files = []
+        for user in current_users:
             try:
+                ref_path = os.path.join(temp_ref_dir, f"{user}.wav")
+                # 参照ファイルがローカルになければクラウドから取得試行
                 if not os.path.exists(ref_path):
+                    print(f"参照音声 {ref_path} がローカルにありません。ダウンロードを試みます...")
+                    if not download_from_cloud(f"{user}.wav", ref_path):
+                        print(f"エラー: {user}.wav のダウンロードに失敗しました。")
+                        missing_files.append(user)
+                        continue # 次のユーザーへ
+                    else:
+                         print(f"クラウドから {user}.wav を {ref_path} にダウンロードしました")
+                # 再度存在確認 (ダウンロード成功したか)
+                if os.path.exists(ref_path):
+                    reference_paths.append(ref_path)
+                else:
+                    # 最終的にファイルが見つからなかった場合
+                    print(f"エラー: ユーザー '{user}' の参照音���ファイルが見つかりません: {ref_path}")
+                    missing_files.append(user)
             except Exception as e:
+                print(f"エラー: ユーザー '{user}' の参照音声準備中にエラーが発生しました: {e}")
+                # エラーが発生したユーザーをリストに追加
+                missing_files.append(user)
+                # エラーの詳細をログに出力
+                traceback.print_exc()
+        # 必要な参照ファイルが不足している場合はエラーを返す
+        if missing_files:
+            return jsonify({"error": f"一部ユーザーの参照音声が見つかりません: {', '.join(missing_files)}"}), 500
+        # 処理に必要なユーザー数と参照ファイル数が一致しない場合もエラー
+        if len(reference_paths) != len(current_users):
+             return jsonify({"error": f"参照音声ファイルの数({len(reference_paths)})がユーザー数({len(current_users)})と一致しません"}), 500
+        # --- ユーザー数に応じて処理分岐 ---
+        if len(current_users) > 1:
+            # --- 複数人処理 ---
+            print(f"複数人 ({len(current_users)}人) の音声処理を開始します。")
+            try:
+                matched_times, merged_segments = process.process_multi_audio(
+                    reference_paths, audio_path, current_users, threshold=0.05
+                )
+                # total_audio = transcripter.save_marged_segments(merged_segments) # 必要なら有効化
+            except Exception as proc_e:
+                 print(f"エラー: process_multi_audio でエラーが発生しました: {proc_e}")
+                 traceback.print_exc()
+                 return jsonify({"error": "音声処理中にエラーが発生しました(multi)", "details": str(proc_e)}), 500
             # 各メンバーのrateを計算
+            total_matched_time = sum(matched_times) # 発話時間の合計
+            user_rates = {} # { 'ユーザー名': rate } 形式の辞書
+            print(f"各ユーザーの発話時間 (秒): {dict(zip(current_users, matched_times))}")
+            print(f"発話時間の合計 (秒): {total_matched_time:.2f}")
+            # 各ユーザーの割合を計算
+            for i in range(len(current_users)):
+                user = current_users[i]
+                time = matched_times[i]
+                # 発話合計時間が0より大きい場合のみ割合計算
+                rate = (time / total_matched_time) * 100 if total_matched_time > 0 else 0
+                # 念のため rate が 0 未満にならないようにする
+                user_rates[user] = max(0, rate)
+            print(f"計算直後の user_rates: {user_rates}")
+            # --- 'その他' の計算と追加 ---
+            current_total_rate = sum(user_rates.values()) # 計算されたレートの合計
+            print(f"計算後の合計レート: {current_total_rate:.2f}%")
+            # 合計が100%未満の場合 (浮動小数点誤差を考慮)
+            # かつ合計が負でないことを確認（通常ありえないが念のため）
+            if current_total_rate < 99.99 and current_total_rate >= 0:
+                other_rate = 100.0 - current_total_rate
+                user_rates['その他'] = other_rate # 'その他' を追加
+                print(f"'その他' ({other_rate:.2f}%) を追加しました。")
+            # オプション: 合計が100%をわずかに超える場合の正規化 (必要に応じてコメント解除)
+            elif current_total_rate > 100.01:
+                print(f"警告: 合計レートが {current_total_rate:.2f}% で100%を超えました。正規化します。")
+                factor = 100.0 / current_total_rate
+                normalized_rates = {}
+                temp_sum = 0
+                keys = list(user_rates.keys())
+                for i, user in enumerate(keys):
+                    if i < len(keys) - 1:
+                       normalized_rate = user_rates[user] * factor
+                       normalized_rates[user] = normalized_rate
+                       temp_sum += normalized_rate
+                    else:
+                       normalized_rates[user] = max(0, 100.0 - temp_sum) # 最後の要素で調整、0未満防止
+                user_rates = normalized_rates
+                print(f"正規化後の user_rates: {user_rates}")
+            print(f"最終的に返す user_rates: {user_rates}")
+            # React側が扱いやすい user_rates 形式で返す
+            return jsonify({"user_rates": user_rates}), 200
         else:
+            # --- 単一ユーザー処理 ---
+            print(f"単一ユーザー ({current_users[0]}) の音声処理を開始します。")
+            try:
+                matched_time, unmatched_time, merged_segments = process.process_audio(
+                    reference_paths[0], audio_path, current_users[0], threshold=0.05
+                )
+                # total_audio = transcripter.save_marged_segments(merged_segments) # 必要なら有効化
+            except Exception as proc_e:
+                 print(f"エラー: process_audio でエラーが発生しました: {proc_e}")
+                 traceback.print_exc()
+                 return jsonify({"error": "音声処理中にエラーが発生しました(single)", "details": str(proc_e)}), 500
             total_time = matched_time + unmatched_time
             rate = (matched_time / total_time) * 100 if total_time > 0 else 0
+            # レートを 0-100 の範囲に収める
+            rate = max(0, min(100, rate))
+            silent_rate = 100.0 - rate
+            # シングルユーザーでも user_rates 形式で統一して返す
+            user_rates = {current_users[0]: rate, '無音': silent_rate}
+            print(f"単一ユーザー、user_rates形式で返す: {user_rates}")
+            return jsonify({"user_rates": user_rates}), 200
     except Exception as e:
+        print(f"エラー: /upload_audio の処理中に予期せぬエラーが発生しました: {e}")
+        # エラーの詳細をスタックトレース付きでログに出力
+        traceback.print_exc()
+        return jsonify({"error": "サーバー内部エラーが発生しました", "details": str(e)}), 500
 # ユーザー選択画面（テンプレート: userSelect.html）
 @app.route('/')