youngtsai commited on
Commit
6544594
·
1 Parent(s): bfdc99a

2. 時間格式需轉換為秒數(例如 1:02 轉為 62 秒),start 和 end 的格式要一樣,都要整數,不要有小數點

Browse files
Files changed (1) hide show
  1. app.py +3 -2
app.py CHANGED
@@ -392,6 +392,7 @@ def extract_youtube_id(url):
392
  return None
393
 
394
  def get_transcript_by_yt_api(video_id):
 
395
  transcript_list = YouTubeTranscriptApi.list_transcripts(video_id)
396
  languages = []
397
  for t in transcript_list:
@@ -531,8 +532,8 @@ def convert_transcription_to_json(original_transcription):
531
  {chunk}
532
 
533
  轉換規則:
534
- 1. 每個段落需包含 text, start, end, duration
535
- 2. 時間格式需轉換為秒數(例如 1:02 轉為 62 秒)
536
  3. duration 為 end - start 的差值
537
  4. 回傳格式為 JSON array
538
  5. 合理的合併句子,不要有不合理的斷句,一句話至少要有完整的主詞、謂詞
 
392
  return None
393
 
394
  def get_transcript_by_yt_api(video_id):
395
+ print("====get_transcript_by_yt_api====")
396
  transcript_list = YouTubeTranscriptApi.list_transcripts(video_id)
397
  languages = []
398
  for t in transcript_list:
 
532
  {chunk}
533
 
534
  轉換規則:
535
+ 1. 每個段落需包含 text, start, end, duration, 這很重要!
536
+ 2. 時間格式需轉換為秒數(例如 1:02 轉為 62 秒),start 和 end 的格式要一樣,都要整數,不要有小數點
537
  3. duration 為 end - start 的差值
538
  4. 回傳格式為 JSON array
539
  5. 合理的合併句子,不要有不合理的斷句,一句話至少要有完整的主詞、謂詞