Spaces:

JunyiAcademy
/

vaitor2

Sleeping

youngtsai commited on Jan 16, 2024

Commit

b7fa139

1 Parent(s): 52d5702

YouTubeTranscriptApi

Files changed (2) hide show

app.py CHANGED Viewed

@@ -6,6 +6,8 @@ from docx import Document
 import os
 from openai import OpenAI
 import json
 OPEN_AI_KEY = os.getenv("OPEN_AI_KEY")
 client = OpenAI(api_key=OPEN_AI_KEY)
@@ -50,7 +52,9 @@ def docx_to_text(file):
 def process_youtube_link(link):
     # 使用 YouTube API 获取逐字稿
     # 假设您已经获取了 YouTube 视频的逐字稿并存储在变量 `transcript` 中
-    transcript = "这里是从 YouTube API 获取的逐字稿文本"
     # 基于逐字稿生成其他所需的输出
     questions = generate_questions(transcript)

 import os
 from openai import OpenAI
 import json
+from youtube_transcript_api import YouTubeTranscriptApi
 OPEN_AI_KEY = os.getenv("OPEN_AI_KEY")
 client = OpenAI(api_key=OPEN_AI_KEY)
 def process_youtube_link(link):
     # 使用 YouTube API 获取逐字稿
     # 假设您已经获取了 YouTube 视频的逐字稿并存储在变量 `transcript` 中
+    video_id = link.split("=")[-1]
+    transcript = YouTubeTranscriptApi.get_transcript(video_id, languages=['zh-TW'])
     # 基于逐字稿生成其他所需的输出
     questions = generate_questions(transcript)

requirements.txt CHANGED Viewed

@@ -3,4 +3,5 @@ pandas
 openai>=1.0.0
 requests
 beautifulsoup4
-python-docx

 openai>=1.0.0
 requests
 beautifulsoup4
+python-docx
+youtube-transcript-api