Spaces:

MonkeyDLLLLLLuffy
/

classagm

Sleeping

App Files Files Community

Leo Liu commited on Mar 7

Commit

59e88fb

verified ·

1 Parent(s): 5756cb3

Update app.py

Browse files

Files changed (1) hide show

app.py +34 -7

app.py CHANGED Viewed

@@ -1,8 +1,20 @@
 # import part
 import streamlit as st
 from transformers import pipeline
 # function part
 # img2text
 def img2text(url):
     image_to_text_model = pipeline("image-to-text", model="Salesforce/blip-image-captioning-base")
@@ -109,14 +121,29 @@ def main():
         with status_container.status("🎵 **Step 3/3**: Adding magic audio...", expanded=True) as status:
             progress_bar.progress(100)
             audio_data = text2audio(story)
             status.update(label="✅ Start playing the story!", state="complete")
-            # Auto-play the audio
-            st.audio(audio_data['audio'],
-                    format="audio/wav",
-                    start_time=0,
-                    sample_rate=audio_data['sampling_rate'],
-                    autoplay=True)
 if __name__ == "__main__":
     main()

 # import part
 import streamlit as st
 from transformers import pipeline
+import math
 # function part
+# 时间戳
+def split_story_with_delay(story_text, sampling_rate=16000):
+    """将故事分割为带时间戳的段落"""
+    words = story_text.split()
+    chunk_size = max(1, len(words)//5)  # 按词数均分5段
+    chunks = [' '.join(words[i:i+chunk_size]) for i in range(0, len(words), chunk_size)]
+    # 假设每段持续2秒（根据音频长度动态调整更佳）
+    duration = len(audio_data["audio"]) / sampling_rate
+    chunk_duration = duration / len(chunks)
+    return list(zip(chunks, [chunk_duration]*len(chunks)))
 # img2text
 def img2text(url):
     image_to_text_model = pipeline("image-to-text", model="Salesforce/blip-image-captioning-base")
         with status_container.status("🎵 **Step 3/3**: Adding magic audio...", expanded=True) as status:
             progress_bar.progress(100)
             audio_data = text2audio(story)
+            # 新增字幕处理
+            subtitle_chunks = split_story_with_delay(story, audio_data['sampling_rate'])
+            current_subtitle = st.empty()
             status.update(label="✅ Start playing the story!", state="complete")
+            # 播放音频并更新字幕
+            with st.audio(...):  # 保持原有参数
+                for text, duration in subtitle_chunks:
+                    current_subtitle.markdown(f"""
+                    <div style="
+                        background: rgba(255,255,255,0.9);
+                        padding: 1rem;
+                        border-radius: 10px;
+                        margin: 1rem 0;
+                        font-size: 1.2rem;
+                        color: #FF6B6B;
+                        text-align: center;
+                        font-family: 'Comic Neue', cursive;
+                    ">{text}</div>
+                    """, unsafe_allow_html=True)
+                    time.sleep(duration)  # 需import time
 if __name__ == "__main__":
     main()