Spaces:

monster119120
/

test

Sleeping

monster119120 commited on Mar 22, 2024

Commit

82ea5b6

verified ·

1 Parent(s): cfd7d35

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,16 +1,3 @@
-import os
-os.system('pip install -r requirements.txt')
-from PIL import Image
-import io
-import streamlit as st
-from transformers import pipeline
-# 初始化视觉问题回答和文本到语音的管道
-# 这里需要替换为你自己的模型，如果使用默认模型则可以省略 model 参数
-vqa_pipeline = pipeline("visual-question-answering")
-tts_pipeline = pipeline("text-to-speech")
 def main():
     st.title("Visual Question Answering & Text-to-Audio App")
@@ -23,13 +10,17 @@ def main():
         # 对用户上传的图片和问题进行视觉问题回答
         vqa_result = vqa_pipeline({"image": image, "question": question})
-        answer = vqa_result[0]['answer']  # 获取回答
         st.write(f"Answer: {answer}")  # 显示回答
-        if st.button("Convert Answer to Audio"):
-            tts_result = tts_pipeline(answer)
-            audio_data = tts_result['audio']  # 获取音频数据
-            st.audio(audio_data, format="audio/ogg")
-if __name__ == "__main__":
-    main()

 def main():
     st.title("Visual Question Answering & Text-to-Audio App")
         # 对用户上传的图片和问题进行视觉问题回答
         vqa_result = vqa_pipeline({"image": image, "question": question})
+        if vqa_result is None:  # 确保返回结果不为空
+            answer = "No answer here!"
+        else:
+            answer = vqa_result[0]['answer']  # 获取回答
         st.write(f"Answer: {answer}")  # 显示回答
+        # 将回答转换为音频
+        tts_result = tts_pipeline(answer)
+        audio_data = tts_result['audio']  # 获取音频数据
+        # 添加一个按钮，让用户选择是否播放音频
+        if st.button('Play Answer Audio'):
+            st.audio(audio_data, format="audio/ogg")