Spaces:
Sleeping
Sleeping
2. 時間格式需轉換為秒數(例如 1:02 轉為 62 秒),start 和 end 的格式要一樣,都要整數,不要有小數點
Browse files
app.py
CHANGED
@@ -392,6 +392,7 @@ def extract_youtube_id(url):
|
|
392 |
return None
|
393 |
|
394 |
def get_transcript_by_yt_api(video_id):
|
|
|
395 |
transcript_list = YouTubeTranscriptApi.list_transcripts(video_id)
|
396 |
languages = []
|
397 |
for t in transcript_list:
|
@@ -531,8 +532,8 @@ def convert_transcription_to_json(original_transcription):
|
|
531 |
{chunk}
|
532 |
|
533 |
轉換規則:
|
534 |
-
1. 每個段落需包含 text, start, end, duration
|
535 |
-
2. 時間格式需轉換為秒數(例如 1:02 轉為 62 秒)
|
536 |
3. duration 為 end - start 的差值
|
537 |
4. 回傳格式為 JSON array
|
538 |
5. 合理的合併句子,不要有不合理的斷句,一句話至少要有完整的主詞、謂詞
|
|
|
392 |
return None
|
393 |
|
394 |
def get_transcript_by_yt_api(video_id):
|
395 |
+
print("====get_transcript_by_yt_api====")
|
396 |
transcript_list = YouTubeTranscriptApi.list_transcripts(video_id)
|
397 |
languages = []
|
398 |
for t in transcript_list:
|
|
|
532 |
{chunk}
|
533 |
|
534 |
轉換規則:
|
535 |
+
1. 每個段落需包含 text, start, end, duration, 這很重要!
|
536 |
+
2. 時間格式需轉換為秒數(例如 1:02 轉為 62 秒),start 和 end 的格式要一樣,都要整數,不要有小數點
|
537 |
3. duration 為 end - start 的差值
|
538 |
4. 回傳格式為 JSON array
|
539 |
5. 合理的合併句子,不要有不合理的斷句,一句話至少要有完整的主詞、謂詞
|