Spaces:

Justtalk
/

JusTalk

Running

App Files Files Community

A-yum1 commited on Mar 19

Commit

7375917

1 Parent(s): cb5ad90

Update transcription.py

Browse files

Files changed (1) hide show

transcription.py +21 -25

transcription.py CHANGED Viewed

@@ -2,7 +2,7 @@ import os
 from faster_whisper import WhisperModel
 class TranscriptionMaker():
-    #書き起こしファイル(ファイル名_transcription.txt)を吐き出すディレクトリを指定
     def __init__(self,output_dir=os.path.abspath("/tmp/data/transcriptions")):
         self.model = WhisperModel("base", device="cpu")
         self.output_dir = output_dir
@@ -13,35 +13,31 @@ class TranscriptionMaker():
             print(f"Error creating directory {self.output_dir}: {e}")
             raise
-    #音声ファイルのパスを受け取り、書き起こしファイルを作成する
-    def create_transcription(self,audio_path):
-        try:
-            if not os.path.isfile(audio_path):
-                raise FileNotFoundError(f"The specified audio file does not exist: {audio_path}")
-            segments, info = self.model.transcribe(audio_path)
-            results = []
             for segment in segments:
                 results.append({
                     "start": segment.start,
                     "end": segment.end,
                     "text": segment.text
                 })
-            #ファイルの書き込み
-            output_file=os.path.join(self.output_dir,os.path.basename(audio_path)+"_transcription.txt")
-            try:
-                with open(output_file,"w",encoding="utf-8") as f:
-                    for result in results:
-                        f.write(f"[{result['start']:.2f}s - {result['end']:.2f}s] {result['text']}\n")
-            except OSError as e:
-                print(f"Error writing transcription file: {e}")
-                raise
-            return output_file
-        except FileNotFoundError as e:
-            print(f"Error: {e}")
             raise
-        except Exception as e:
-            print(f"An unexpected error occurred: {e}")
-            raise

 from faster_whisper import WhisperModel
 class TranscriptionMaker():
+    #書き起こしファイルを吐き出すディレクトリを指定
     def __init__(self,output_dir=os.path.abspath("/tmp/data/transcriptions")):
         self.model = WhisperModel("base", device="cpu")
         self.output_dir = output_dir
             print(f"Error creating directory {self.output_dir}: {e}")
             raise
+    #音声ファイルのディレクトリを受け取り、書き起こしファイルを作成する
+    def create_transcription(self,audio_directory):
+        results = []
+        #ディレクトリ内のファイルを全て取得
+        audio_files = os.listdir(audio_directory)
+        for audio_file in audio_files:
+            if os.path.splitext(audio_file)[-1].lower() != '.wav':
+                continue
+            audio_path =  os.path.join(audio_directory, audio_file)
+            segments,info = list(self.model.transcribe(audio_path))
             for segment in segments:
                 results.append({
                     "start": segment.start,
                     "end": segment.end,
                     "text": segment.text
                 })
+        #ファイルの書き込み。ファイル名は"読み込みディレクトリ名_transcription.txt"
+        output_file=os.path.join(self.output_dir,os.path.basename(audio_directory)+"_transcription.txt")
+        try:
+            with open(output_file,"w",encoding="utf-8") as f:
+                for result in results:
+                    f.write(f"{result['text']}\n")
+        except OSError as e:
+            print(f"Error writing transcription file: {e}")
             raise
+        return output_file