Spaces:

Justtalk
/

JusTalk

Running

App Files Files Community

buletomato25 commited on Mar 20

Commit

48f9750

2 Parent(s): cfeb3ec 0dcfc65

addupload_base_audio

Browse files

Files changed (5) hide show

__pycache__/process.cpython-310.pyc +0 -0
app.py +22 -133
templates/index.html +75 -195
templates/userRegister.html +225 -0
transcription.py +26 -26

__pycache__/process.cpython-310.pyc CHANGED Viewed

Binary files a/__pycache__/process.cpython-310.pyc and b/__pycache__/process.cpython-310.pyc differ

app.py CHANGED Viewed

@@ -1,151 +1,34 @@
-from flask import Flask, request, jsonify, render_template, send_from_directory,redirect, make_response, Response, session, url_for
 import base64
 from pydub import AudioSegment  # 変換用にpydubをインポート
 import os
 import shutil
-import numpy as np
-import string
-import random
-from datetime import datetime, timedelta
-from pyannote.audio import Model, Inference
-from pydub import AudioSegment
-from flask_sqlalchemy import SQLAlchemy
-from dotenv import load_dotenv
-from google.oauth2 import id_token
-from google_auth_oauthlib.flow import Flow
-from google.auth.transport import requests as google_requests
-# Hugging Face のトークン取得（環境変数 HF に設定）
-#hf_token = os.environ.get("HF")
-load_dotenv()
-hf_token = os.getenv("HF")
-if hf_token is None:
-    raise ValueError("HUGGINGFACE_HUB_TOKEN が設定されていません。")
-# キャッシュディレクトリの作成（書き込み可能な /tmp を利用）
-cache_dir = "/tmp/hf_cache"
-os.makedirs(cache_dir, exist_ok=True)
-# pyannote モデルの読み込み
-model = Model.from_pretrained("pyannote/embedding", use_auth_token=hf_token, cache_dir=cache_dir)
-inference = Inference(model)
 app = Flask(__name__)
-app.config['SECRET_KEY'] = os.urandom(24)
-def cosine_similarity(vec1, vec2):
-    vec1 = vec1 / np.linalg.norm(vec1)
-    vec2 = vec2 / np.linalg.norm(vec2)
-    return np.dot(vec1, vec2)
-def segment_audio(path, target_path='/tmp/setup_voice', seg_duration=1.0):
-    """
-    音声を指定秒数ごとに分割する。
-    target_path に分割したファイルを保存し、元の音声の総長（ミリ秒）を返す。
-    """
-    os.makedirs(target_path, exist_ok=True)
-    base_sound = AudioSegment.from_file(path)
-    duration_ms = len(base_sound)
-    seg_duration_ms = int(seg_duration * 1000)
-    for i, start in enumerate(range(0, duration_ms, seg_duration_ms)):
-        end = min(start + seg_duration_ms, duration_ms)
-        segment = base_sound[start:end]
-        segment.export(os.path.join(target_path, f'{i}.wav'), format="wav")
-    return target_path, duration_ms
-def calculate_similarity(path1, path2):
-    embedding1 = inference(path1)
-    embedding2 = inference(path2)
-    return float(cosine_similarity(embedding1.data.flatten(), embedding2.data.flatten()))
-def process_audio(reference_path, input_path, output_folder='/tmp/data/matched_segments', seg_duration=1.0, threshold=0.5):
-    """
-    入力音声ファイルを seg_duration 秒ごとに分割し、各セグメントと参照音声の類似度を計算。
-    類似度が threshold を超えたセグメントを output_folder にコピーし、マッチした時間（ms）と
-    マッチしなかった時間（ms）を返す。
-    """
-    os.makedirs(output_folder, exist_ok=True)
-    segmented_path, total_duration_ms = segment_audio(input_path, seg_duration=seg_duration)
-    matched_time_ms = 0
-    for file in sorted(os.listdir(segmented_path)):
-        segment_file = os.path.join(segmented_path, file)
-        similarity = calculate_similarity(segment_file, reference_path)
-        if similarity > threshold:
-            shutil.copy(segment_file, output_folder)
-            matched_time_ms += len(AudioSegment.from_file(segment_file))
-    unmatched_time_ms = total_duration_ms - matched_time_ms
-    return matched_time_ms, unmatched_time_ms
-def generate_random_string(length):
-    letters = string.ascii_letters + string.digits
-    return ''.join(random.choice(letters) for i in range(length))
-def generate_filename(random_length):
-    random_string = generate_random_string(random_length)
-    current_time = datetime.now().strftime("%Y%m%d%H%M%S")
-    filename = f"{current_time}_{random_string}.wav"
-    return filename
 # トップページ（テンプレート: index.html）
 @app.route('/')
-def top():
-    return redirect('index')
 # フィードバック画面（テンプレート: feedback.html）
 @app.route('/feedback', methods=['GET', 'POST'])
 def feedback():
-    #ログイン問題解決しだい戻す
-    """
-    if 'google_id' not in session:
-        return redirect(url_for('login'))
-    user_info = {
-        'name': session.get('name'),
-        'email': session.get('email')
-    }
-    """
     return render_template('feedback.html')
 # 会話詳細画面（テンプレート: talkDetail.html）
 @app.route('/talk_detail', methods=['GET', 'POST'])
 def talk_detail():
-    """
-    if 'google_id' not in session:
-        return redirect(url_for('login'))
-    user_info = {
-        'name': session.get('name'),
-        'email': session.get('email')
-   }
-   """
     return render_template('talkDetail.html')
-   # インデックス画面（テンプレート: index.html）
-@app.route('/index', methods=['GET', 'POST'])
-def index():
-    """
-   if 'google_id' not in session:
-        return redirect(url_for('login'))
-   user_info = {
-        'name': session.get('name'),
-        'email': session.get('email')
-   }
-   """
-    return render_template('index.html')
-@app.before_request
-def before_request():
-    # リクエストのたびにセッションの寿命を更新する
-    session.permanent = True
-    app.permanent_session_lifetime = timedelta(minutes=15)
-    session.modified = True
 # 音声アップロード＆解析エンドポイント
 @app.route('/upload_audio', methods=['POST'])
@@ -183,15 +66,23 @@ def upload_audio():
 def upload_base_audio():
     try:
         data = request.get_json()
-        if not data or 'audio_data' not in data:
-            return jsonify({"error": "音声データがありません"}), 400
         # Base64デコードして音声バイナリを取得
         audio_binary = base64.b64decode(data['audio_data'])
         # 保存先ディレクトリの作成
         audio_dir = "/tmp/data/base_audio"
         os.makedirs(audio_dir, exist_ok=True)
         # 一時ファイルに保存（実際の形式は WebM などと仮定）
         temp_audio_path = os.path.join(audio_dir, "temp_audio")
@@ -216,8 +107,6 @@ def upload_base_audio():
         print("Error in /upload_base_audio:", str(e))
         return jsonify({"error": "サーバーエラー", "details": str(e)}), 500
 if __name__ == '__main__':
     port = int(os.environ.get("PORT", 7860))
-    app.run(debug=True, host="0.0.0.0", port=port)

+from flask import Flask, request, jsonify, render_template, send_from_directory
 import base64
 from pydub import AudioSegment  # 変換用にpydubをインポート
 import os
 import shutil
+from process import AudioProcessor
+process=AudioProcessor()
 app = Flask(__name__)
 # トップページ（テンプレート: index.html）
 @app.route('/')
+@app.route('/index', methods=['GET', 'POST'])
+def index():
+    return render_template('index.html')
 # フィードバック画面（テンプレート: feedback.html）
 @app.route('/feedback', methods=['GET', 'POST'])
 def feedback():
     return render_template('feedback.html')
 # 会話詳細画面（テンプレート: talkDetail.html）
 @app.route('/talk_detail', methods=['GET', 'POST'])
 def talk_detail():
     return render_template('talkDetail.html')
+# 音声登録画面（テンプレート: userRegister.html）
+@app.route('/userregister', methods=['GET', 'POST'])
+def userregister():
+    return render_template('userregister.html')
 # 音声アップロード＆解析エンドポイント
 @app.route('/upload_audio', methods=['POST'])
 def upload_base_audio():
     try:
         data = request.get_json()
+        if not data or 'audio_data' not in data or 'name' not in data:
+            return jsonify({"error": "音声データまたは名前がありません"}), 400
         # Base64デコードして音声バイナリを取得
         audio_binary = base64.b64decode(data['audio_data'])
+        name = data['name']  # 名前を取得
         # 保存先ディレクトリの作成
         audio_dir = "/tmp/data/base_audio"
         os.makedirs(audio_dir, exist_ok=True)
+        # 辞書型を作成（音声データと名前）
+        audio_info = {
+            "name": name,
+            "audio_data": audio_binary  # バイナリデータをそのまま格納
+        }
         # 一時ファイルに保存（実際の形式は WebM などと仮定）
         temp_audio_path = os.path.join(audio_dir, "temp_audio")
         print("Error in /upload_base_audio:", str(e))
         return jsonify({"error": "サーバーエラー", "details": str(e)}), 500
 if __name__ == '__main__':
     port = int(os.environ.get("PORT", 7860))
+    app.run(debug=True, host="0.0.0.0", port=port)

templates/index.html CHANGED Viewed

@@ -4,80 +4,52 @@
     <meta charset="UTF-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" />
     <title>Voice Recorder Interface</title>
-    <link
-      href="https://cdn.jsdelivr.net/npm/[email protected]/dist/css/bootstrap.min.css"
-      rel="stylesheet"
-    />
     <style>
-      body {
-        display: flex;
-        flex-direction: column;
-        justify-content: center;
-        align-items: center;
-        height: 100vh;
-        margin: 0;
-        background-color: #121212;
-        color: white;
-      }
-      /* トグルスイッチ（基準音声保存用） */
-      .toggle-container {
-        display: flex;
-        align-items: center;
-        margin-bottom: 20px;
-      }
-      .toggle-label {
-        margin-right: 10px;
-      }
-      .toggle-switch {
-        position: relative;
-        display: inline-block;
-        width: 50px;
-        height: 24px;
-      }
-      .toggle-switch input {
-        opacity: 0;
-        width: 0;
-        height: 0;
-      }
-      .slider {
-        position: absolute;
-        cursor: pointer;
-        top: 0;
-        left: 0;
-        right: 0;
-        bottom: 0;
-        background-color: #757575;
-        transition: 0.2s;
-        border-radius: 34px;
-      }
-      .slider::before {
-        content: "";
-        position: absolute;
-        height: 18px;
-        width: 18px;
-        left: 4px;
-        bottom: 3px;
-        background-color: white;
-        transition: 0.2s;
-        border-radius: 50%;
-      }
-      input:checked + .slider {
-        background-color: #4caf50;
-      }
-      input:checked + .slider::before {
-        transform: translateX(26px);
-      }
-      /* チャートのスタイル */
-      .chart {
-        width: 300px;
-        height: 300px;
-        margin-bottom: 20px; /* 円グラフとボタンの間隔を狭く */
-      }
-      .controls {
-        display: flex;
-        flex-direction: column;
-        align-items: center;
-      }
       .record-button {
         width: 80px;
         height: 80px;
@@ -91,6 +63,7 @@
         box-shadow: 0 4px 6px rgba(0, 0, 0, 0.4);
         transition: all 0.2s ease;
       }
       .record-icon {
         width: 60px;
         height: 60px;
@@ -98,83 +71,35 @@
         border-radius: 50%;
         transition: all 0.2s ease;
       }
       .recording .record-icon {
         width: 40px;
         height: 40px;
         border-radius: 10%;
       }
-      .result-button {
-        margin-left: 10px;
-        margin-top: 20px;
-        padding: 10px 20px;
-        background-color: #4caf50;
-        border: none;
-        border-radius: 5px;
-        color: white;
-        cursor: pointer;
-        box-shadow: 0 4px 6px rgba(0, 0, 0, 0.4);
-      }
-      .result {
-        display: flex;
-      }
-      .result-button:hover {
-        background-color: #388e3c;
-      }
-      header {
-        display: flex;
-      }
     </style>
-    <script src="https://cdn.jsdelivr.net/npm/chart.js"></script>
-  </head>
-  <body>
-    <!-- トグルスイッチ：基準音声保存モード -->
-    <div class="toggle-container">
-      <span class="toggle-label">基準音声を保存</span>
-      <label class="toggle-switch">
-        <input type="checkbox" id="baseVoiceToggle" />
-        <span class="slider"></span>
-      </label>
-    </div>
-    <!-- チャート表示部 -->
-    <div class="chart">
-      <canvas id="speechChart"></canvas>
-    </div>
-    <!-- 録音ボタン -->
-    <button class="record-button" id="recordButton" onclick="toggleRecording()">
-      <div class="record-icon" id="recordIcon"></div>
-    </button>
-    <!-- 結果ボタン -->
-    <div class="result-buttons">
-      <button class="result-button" id="historyButton" onclick="showHistory()">
-        会話履歴を表示
-      </button>
-      <button class="result-button" id="feedbackButton" onclick="showResults()">
-        フィードバック画面を表示
-      </button>
-    </div>
     <script>
       let isRecording = false;
       let mediaRecorder;
       let audioChunks = [];
-      let recordingInterval; // 通常モードでの10秒周期用
-      let baseTimeout; // 基準音声モード用のタイマー
       let count_voice = 0;
       let before_rate = 0;
       // Chart.js の初期化
       const ctx = document.getElementById("speechChart").getContext("2d");
       const speechChart = new Chart(ctx, {
         type: "doughnut",
         data: {
-          labels: ["自分", "他の人"],
           datasets: [
             {
-              data: [30, 70],
               backgroundColor: ["#4caf50", "#757575"],
             },
           ],
@@ -191,9 +116,20 @@
         },
       });
-      // トグルの状態を取得する関数
-      function isBaseVoiceMode() {
-        return document.getElementById("baseVoiceToggle").checked;
       }
       async function toggleRecording() {
@@ -222,26 +158,6 @@
             };
             mediaRecorder.start();
-            if (isBaseVoiceMode()) {
-              // 基準音声モード：10秒後に自動停止するタイマーをセット
-              baseTimeout = setTimeout(() => {
-                if (mediaRecorder && mediaRecorder.state === "recording") {
-                  mediaRecorder.stop();
-                  // 10秒経過しても録音ボタンがONなら強制的に停止＆トグルをオフにする
-                  isRecording = false;
-                  recordButton.classList.remove("recording");
-                  document.getElementById("baseVoiceToggle").checked = false;
-                }
-              }, 10000);
-            } else {
-              // 通常モード：10秒ごとに自動停止して送信、継続録音する処理
-              recordingInterval = setInterval(() => {
-                if (mediaRecorder && mediaRecorder.state === "recording") {
-                  mediaRecorder.stop();
-                }
-              }, 10000);
-            }
           } catch (error) {
             console.error("マイクへのアクセスに失敗しました:", error);
             isRecording = false;
@@ -251,11 +167,6 @@
           // 手動停止
           isRecording = false;
           recordButton.classList.remove("recording");
-          if (isBaseVoiceMode()) {
-            clearTimeout(baseTimeout);
-          } else {
-            clearInterval(recordingInterval);
-          }
           if (mediaRecorder && mediaRecorder.state === "recording") {
             mediaRecorder.stop();
             count_voice = 0;
@@ -269,11 +180,7 @@
         const reader = new FileReader();
         reader.onloadend = () => {
           const base64String = reader.result.split(",")[1]; // Base64エンコードされた音声データ
-          // エンドポイントの選択：基準音声モードなら '/upload_base_audio'
-          const endpoint = isBaseVoiceMode()
-            ? "/upload_base_audio"
-            : "/upload_audio";
-          fetch(endpoint, {
             method: "POST",
             headers: {
               "Content-Type": "application/json",
@@ -285,7 +192,7 @@
               if (data.error) {
                 alert("エラー: " + data.error);
                 console.error(data.details);
-              } else if (data.rate !== undefined && !isBaseVoiceMode()) {
                 // 通常モードの場合、解析結果をチャートに反映
                 if (count_voice === 0) {
                   speechChart.data.datasets[0].data = [
@@ -310,44 +217,17 @@
                 }
                 count_voice++;
                 speechChart.update();
-              } else {
-                // 基準音声モードまたは解析結果がない場合
-                if (isBaseVoiceMode()) {
-                  //alert('基準音声が保存されました。');
-                  // トグルをリセット
-                  document.getElementById("baseVoiceToggle").checked = false;
-                } else {
-                  //alert('音声がバックエンドに送信されました。');
-                }
-              }
-              // 通常モードの場合、録音が継続中なら次の録音を開始（自動連続録音）
-              if (
-                !isBaseVoiceMode() &&
-                isRecording &&
-                mediaRecorder &&
-                mediaRecorder.state === "inactive"
-              ) {
-                mediaRecorder.start();
               }
             })
             .catch((error) => {
               console.error("エラー:", error);
-              if (
-                !isBaseVoiceMode() &&
-                isRecording &&
-                mediaRecorder &&
-                mediaRecorder.state === "inactive"
-              ) {
-                mediaRecorder.start();
-              }
             });
         };
         reader.readAsDataURL(audioBlob);
       }
-      function showHistory() {
-        window.location.href = "history";
-        alert("会話履歴を表示する機能は未実装です。");
       }
       function showResults() {
@@ -355,9 +235,9 @@
         window.location.href = "feedback";
       }
-      function showLogin() {
-        // フィードバック画面へ遷移
-        window.location.href = "login";
       }
     </script>
   </body>

     <meta charset="UTF-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" />
     <title>Voice Recorder Interface</title>
+    <script src="https://cdn.jsdelivr.net/npm/chart.js"></script>
+    <script src="https://cdn.tailwindcss.com"></script>
+  </head>
+  <body
+    class="flex flex-col items-center justify-center h-screen bg-gray-900 text-white"
+  >
+    <!-- メンバーを登録ボタン -->
+    <div class="flex items-center mb-5">
+      <button
+        id="registerButton"
+        onclick="showUserRegister()"
+        class="px-4 py-2 bg-blue-600 rounded-md hover:bg-blue-700 transition"
+      >
+        メンバーを登録
+      </button>
+    </div>
+    <!-- チャート表示部 -->
+    <div class="chart w-72 h-72 mb-5">
+      <canvas id="speechChart"></canvas>
+    </div>
+    <!-- 録音ボタン -->
+    <button class="record-button" id="recordButton" onclick="toggleRecording()">
+      <div class="record-icon" id="recordIcon"></div>
+    </button>
+    <!-- 結果ボタン -->
+    <div class="flex mt-5">
+      <button
+        id="historyButton"
+        onclick="showTalkdetail()"
+        class="result-button px-4 py-2 mx-2 bg-green-600 rounded-md hover:bg-green-700 transition"
+      >
+        会話履歴を表示
+      </button>
+      <button
+        id="feedbackButton"
+        onclick="showResults()"
+        class="result-button px-4 py-2 mx-2 bg-blue-600 rounded-md hover:bg-blue-700 transition"
+      >
+        フィードバック画面を表示
+      </button>
+    </div>
     <style>
       .record-button {
         width: 80px;
         height: 80px;
         box-shadow: 0 4px 6px rgba(0, 0, 0, 0.4);
         transition: all 0.2s ease;
       }
       .record-icon {
         width: 60px;
         height: 60px;
         border-radius: 50%;
         transition: all 0.2s ease;
       }
       .recording .record-icon {
         width: 40px;
         height: 40px;
         border-radius: 10%;
       }
     </style>
     <script>
       let isRecording = false;
       let mediaRecorder;
       let audioChunks = [];
+      let recordingInterval;
       let count_voice = 0;
       let before_rate = 0;
+      // 初期設定：人数と名前を受け取って円グラフを作成
+      let members = ["自分", "ahaha", "nufufu", "不明"];
+      let voiceData = [50, 20, 20, 10]; // 自分と不明の割合を仮設定
       // Chart.js の初期化
       const ctx = document.getElementById("speechChart").getContext("2d");
       const speechChart = new Chart(ctx, {
         type: "doughnut",
         data: {
+          labels: members,
           datasets: [
             {
+              data: voiceData,
               backgroundColor: ["#4caf50", "#757575"],
             },
           ],
         },
       });
+      //録音ボタン見た目変化
+      function toggleRecording() {
+        isRecording = !isRecording;
+        const recordIcon = document.getElementById("recordIcon");
+        if (isRecording) {
+          recordIcon.classList.add("w-10", "h-10", "bg-red-900", "rounded-md");
+        } else {
+          recordIcon.classList.remove(
+            "w-10",
+            "h-10",
+            "bg-red-900",
+            "rounded-md"
+          );
+        }
       }
       async function toggleRecording() {
             };
             mediaRecorder.start();
           } catch (error) {
             console.error("マイクへのアクセスに失敗しました:", error);
             isRecording = false;
           // 手動停止
           isRecording = false;
           recordButton.classList.remove("recording");
           if (mediaRecorder && mediaRecorder.state === "recording") {
             mediaRecorder.stop();
             count_voice = 0;
         const reader = new FileReader();
         reader.onloadend = () => {
           const base64String = reader.result.split(",")[1]; // Base64エンコードされた音声データ
+          fetch("/upload_audio", {
             method: "POST",
             headers: {
               "Content-Type": "application/json",
               if (data.error) {
                 alert("エラー: " + data.error);
                 console.error(data.details);
+              } else if (data.rate !== undefined) {
                 // 通常モードの場合、解析結果をチャートに反映
                 if (count_voice === 0) {
                   speechChart.data.datasets[0].data = [
                 }
                 count_voice++;
                 speechChart.update();
               }
             })
             .catch((error) => {
               console.error("エラー:", error);
             });
         };
         reader.readAsDataURL(audioBlob);
       }
+      function showTalkdetail() {
+        window.location.href = "talk_detail";
       }
       function showResults() {
         window.location.href = "feedback";
       }
+      function showUserRegister() {
+        // 音声登録画面へ遷移
+        window.location.href = "userregister";
       }
     </script>
   </body>

templates/userRegister.html ADDED Viewed

	@@ -0,0 +1,225 @@

+<!DOCTYPE html>
+<html lang="ja">
+  <head>
+    <meta charset="UTF-8" />
+    <title>ユーザー音声登録</title>
+    <script src="https://cdn.tailwindcss.com"></script>
+    <style>
+      @keyframes pulse-scale {
+        0%,
+        100% {
+          transform: scale(1);
+        }
+        50% {
+          transform: scale(1.1);
+        }
+      }
+      .animate-pulse-scale {
+        animation: pulse-scale 1s infinite;
+      }
+      .record-button {
+        width: 50px;
+        height: 50px;
+        background-color: transparent;
+        border-radius: 50%;
+        border: 2px solid white;
+        display: flex;
+        justify-content: center;
+        align-items: center;
+        cursor: pointer;
+        box-shadow: 0 4px 6px rgba(0, 0, 0, 0.4);
+        transition: all 0.3s ease;
+      }
+      .record-icon {
+        width: 35px;
+        height: 35px;
+        background-color: #d32f2f;
+        border-radius: 50%;
+        transition: all 0.3s ease;
+      }
+      .record-button.recording .record-icon {
+        border-radius: 4px; /* 録音時に赤い部分だけ四角にする */
+      }
+      .recording .record-icon {
+        width: 20px;
+        height: 20px;
+        border-radius: 50%;
+      }
+      @media (max-width: 640px) {
+        .container {
+          padding: 2rem;
+        }
+      }
+    </style>
+  </head>
+  <body
+    class="bg-gray-800 text-gray-100 dark:bg-gray-900 dark:text-gray-300 transition-colors"
+  >
+    <div class="container mx-auto p-5 max-w-full sm:max-w-2xl">
+      <div id="people-list" class="space-y-4"></div>
+      <button
+        id="add-btn"
+        class="mt-6 px-6 py-2 bg-green-500 text-white rounded-lg hover:bg-green-600 transition-colors"
+      >
+        メンバーを追加
+      </button>
+      <!-- 録音画面に戻るボタン -->
+      <button
+        id="backButton"
+        class="mt-6 px-6 py-2 bg-blue-500 text-white rounded-lg hover:bg-blue-600 transition-colors"
+      >
+        録音画面に戻る
+      </button>
+    </div>
+    <script>
+      let mediaRecorder;
+      let audioChunks = [];
+      let userCount = 0; // 追加されたメンバー数を保持
+      let isRecording = false; // 録音中かどうかを判定するフラグ
+      let currentRecordingButton = null; // 現在録音中のボタンを保持
+      function toggleRecording(button) {
+        button.classList.toggle("recording");
+      }
+      async function startRecording(button) {
+        if (isRecording && currentRecordingButton !== button) return; // 他の人が録音中なら何もしない
+        isRecording = true; // 録音中に設定
+        currentRecordingButton = button; // 録音中のボタンを記録
+        try {
+          const stream = await navigator.mediaDevices.getUserMedia({
+            audio: true,
+          });
+          mediaRecorder = new MediaRecorder(stream, { mimeType: "audio/webm" });
+          audioChunks = [];
+          mediaRecorder.ondataavailable = (e) => audioChunks.push(e.data);
+          mediaRecorder.onstop = () => {
+            sendAudioChunks(audioChunks, button); // ボタン情報を渡す
+            audioChunks = [];
+            isRecording = false; // 録音停止後はフラグを戻す
+            currentRecordingButton = null; // 録音ボタンを解除
+          };
+          mediaRecorder.start();
+          toggleRecording(button);
+        } catch (err) {
+          console.error("マイクアクセスに失敗しました:", err);
+          isRecording = false; // エラー発生時もフラグを戻す
+          currentRecordingButton = null;
+        }
+      }
+      function stopRecording(button) {
+        if (!isRecording) return; // 録音中でない場合は停止しない
+        mediaRecorder.stop();
+        toggleRecording(button);
+      }
+      function handleRecording(e) {
+        const button = e.target.closest(".record-button");
+        if (button) {
+          if (isRecording && currentRecordingButton !== button) {
+            // 他の人が録音中なら反応しない
+            return;
+          }
+          if (mediaRecorder && mediaRecorder.state === "recording") {
+            stopRecording(button);
+          } else {
+            startRecording(button);
+          }
+        }
+      }
+      function sendAudioChunks(chunks, button) {
+        // 引数に button を追加
+        const audioBlob = new Blob(chunks, { type: "audio/wav" });
+        const reader = new FileReader();
+        reader.onloadend = () => {
+          const base64String = reader.result.split(",")[1]; // Base64エンコードされた音声データ
+          const form = button.closest("form");
+          const nameInput = form.querySelector('input[name="name"]');
+          const name = nameInput ? nameInput.value : "unknown"; // 名前がない
+          fetch("/upload_base_audio", {
+            method: "POST",
+            headers: {
+              "Content-Type": "application/json",
+            },
+            body: JSON.stringify({ audio_data: base64String, name: name }),
+          })
+            .then((response) => response.json())
+            .then((data) => {
+              // エラー処理のみ残す
+              if (data.error) {
+                alert("エラー: " + data.error);
+                console.error(data.details);
+              }
+              // 成功時の処理（ボタンの有効化など）
+              else {
+                console.log("音声データ送信成功:", data);
+                // 必要に応じて、ここでUIの変更（ボタンの有効化など）を行う
+                // 例: button.disabled = true; // 送信ボタンを無効化
+                // 例: button.classList.remove("recording"); //録音中のスタイルを解除
+              }
+            })
+            .catch((error) => {
+              console.error("エラー:", error);
+            });
+        };
+        reader.readAsDataURL(audioBlob);
+      }
+      document.getElementById("add-btn").addEventListener("click", () => {
+        const newItem = document.createElement("div");
+        newItem.className = "flex items-center gap-3 flex-wrap";
+        newItem.innerHTML = `
+              <form
+                  action="/submit"
+                  method="POST"
+                  class="flex items-center space-x-2 w-full sm:w-auto"
+                  onsubmit="event.preventDefault();"
+              >
+                  <input
+                      type="text"
+                      name="name"
+                      placeholder="名前を入力"
+                      class="flex-1 px-4 py-2 border rounded-lg focus:outline-none focus:ring-2 focus:ring-blue-500 bg-gray-700 text-white"
+                  />
+                  <button type="button" class="record-button" aria-label="音声録音開始">
+                      <div class="record-icon"></div>
+                  </button>
+                  <button
+                      type="submit"
+                      class="submit-button px-4 py-2 border rounded-lg bg-blue-500 text-white hover:bg-blue-600"
+                  >
+                      送信
+                  </button>
+              </form>
+          `;
+        newItem.addEventListener("click", handleRecording);
+        document.getElementById("people-list").appendChild(newItem);
+        userCount++; // 新しいメンバーを追加するたびにカウントを増やす
+      });
+      // 「録音画面に戻る」ボタンの処理
+      document
+        .getElementById("backButton")
+        .addEventListener("click", function () {
+          // メンバーの人数を送信する
+          sendUserCount();
+          // index.htmlに戻る
+          window.location.href = "index.html";
+        });
+      // メンバーの人数を送信する関数
+      function sendUserCount() {
+        console.log(`追加された人数: ${userCount}`);
+        // ここで人数を送信する処理を実行（例: fetchを使ってサーバーに送信）
+      }
+    </script>
+  </body>
+</html>

transcription.py CHANGED Viewed

@@ -2,7 +2,7 @@ import os
 from faster_whisper import WhisperModel
 class TranscriptionMaker():
-    #書き起こしファイル(ファイル名_transcription.txt)を吐き出すディレクトリを指定
     def __init__(self,output_dir=os.path.abspath("/tmp/data/transcriptions")):
         self.model = WhisperModel("base", device="cpu")
         self.output_dir = output_dir
@@ -13,35 +13,35 @@ class TranscriptionMaker():
             print(f"Error creating directory {self.output_dir}: {e}")
             raise
-    #音声ファイルのパスを受け取り、書き起こしファイルを作成する
-    def create_transcription(self,audio_path):
-        try:
-            if not os.path.isfile(audio_path):
-                raise FileNotFoundError(f"The specified audio file does not exist: {audio_path}")
-            segments, info = self.model.transcribe(audio_path)
-            results = []
             for segment in segments:
                 results.append({
                     "start": segment.start,
                     "end": segment.end,
                     "text": segment.text
                 })
-            #ファイルの書き込み
-            output_file=os.path.join(self.output_dir,os.path.basename(audio_path)+"_transcription.txt")
-            try:
-                with open(output_file,"w",encoding="utf-8") as f:
-                    for result in results:
-                        f.write(f"[{result['start']:.2f}s - {result['end']:.2f}s] {result['text']}\n")
-            except OSError as e:
-                print(f"Error writing transcription file: {e}")
-                raise
-            return output_file
-        except FileNotFoundError as e:
-            print(f"Error: {e}")
             raise
-        except Exception as e:
-            print(f"An unexpected error occurred: {e}")
-            raise

 from faster_whisper import WhisperModel
 class TranscriptionMaker():
+    #書き起こしファイルを吐き出すディレクトリを指定
     def __init__(self,output_dir=os.path.abspath("/tmp/data/transcriptions")):
         self.model = WhisperModel("base", device="cpu")
         self.output_dir = output_dir
             print(f"Error creating directory {self.output_dir}: {e}")
             raise
+    #音声ファイルのディレクトリを受け取り、書き起こしファイルを作成する
+    def create_transcription(self,audio_directory):
+        results = []
+        #ディレクトリ内のファイルを全て取得
+        if not os.path.isdir(audio_directory):
+            raise ValueError(f"The specified path is not a valid directory: {audio_directory}")
+        audio_files = os.listdir(audio_directory)
+        for audio_file in audio_files:
+            if os.path.splitext(audio_file)[-1].lower() != '.wav':
+                continue
+            audio_path =  os.path.join(audio_directory, audio_file)
+            try:
+                segments,info = list(self.model.transcribe(audio_path))
+            except Exception as e:
+                print(f"Error transcripting file {audio_path}: {e}")
+                raise
             for segment in segments:
                 results.append({
                     "start": segment.start,
                     "end": segment.end,
                     "text": segment.text
                 })
+        #ファイルの書き込み。ファイル名は"読み込みディレクトリ名_transcription.txt"
+        output_file=os.path.join(self.output_dir,os.path.basename(audio_directory)+"_transcription.txt")
+        try:
+            with open(output_file,"w",encoding="utf-8") as f:
+                for result in results:
+                    f.write(f"{result['text']}\n")
+        except OSError as e:
+            print(f"Error writing transcription file: {e}")
             raise
+        return output_file