key_moment["keywords"] = generate_key_moments_keywords(transcript) dcbbabb youngtsai commited on Apr 7, 2024
prompt="Transcribe the following audio file. if content is chinese, please using 'language: zh-TW' ", 7a116ca youngtsai commited on Apr 7, 2024
7. text, transcript, keywords please use or transfer zh-TW, it's very important bb65b39 youngtsai commited on Apr 7, 2024
6. 關鍵字從transcript extract to keyword,保留專家名字、專業術語、年份、數字、期刊名稱、地名、數學公式 a49dad3 youngtsai commited on Apr 7, 2024
- 只要是參考逐字稿資料,please use the timestamp format, example:【參考資料:00:00:00】 439054b youngtsai commited on Apr 7, 2024
- 只要是參考逐字稿資料,please use the timestamp format, example:【參考資料:00:00:00】 65acd94 youngtsai commited on Apr 7, 2024
content=user_message + "/n (請一定要用繁體中文回答 zh-TW,請嚴格遵循instructions,擔任一位蘇格拉底家教,並用台灣人的禮貌口語表達,回答時不要特別說明這是台灣人的語氣,不用提到「逐字稿」這個詞,用「內容」代替),回答時請用數學符號代替文字(Latex 用 $ 字號 render)" 769ca2b youngtsai commited on Apr 7, 2024
questions_json = gr.Textbox(label="Questions", lines=40, interactive=False, show_copy_button=True) b0115e9 youngtsai commited on Apr 7, 2024
print("=== transcript_text is too long, replace by key_moments_text ===") c253d61 youngtsai commited on Apr 6, 2024
2. 每一小段最多不超過 1/5 的總內容,也就是大約 3~5段的重點(例如五~十分鐘的影片就一段大約1~2分鐘,最多三分鐘,但如果是超過十分鐘的影片,那一小段大約 2~3分鐘,以此類推) a008d2c youngtsai commited on Apr 4, 2024
content=user_message + "/n (請一定要用繁體中文回答 zh-TW,並用台灣人的禮貌口語表達,回答時不要特別說明這是台灣人的語氣,不用提到「逐字稿」這個詞,用「內容」代替),回答時請用數學符號代替文字(Latex 用 $ 字號 render)" 5a81181 youngtsai commited on Apr 3, 2024
user_message += "/n (請一定要用繁體中文回答 zh-TW,並用台灣人的禮貌口語表達,回答時不要特別說明這是台灣人的語氣,不用提到「逐字稿」這個詞,用「內容」代替)" dc8d82f youngtsai commited on Apr 3, 2024
return admin, reading_passage_admin, summary_admin, see_detail, password_text, youtube_link c32db54 youngtsai commited on Apr 3, 2024