Spaces:

dayuan
/

model

Build error

App Files Files Community

dayuan commited on Feb 11, 2023

Commit

64a9585

1 Parent(s): b95b9dc

first commit

Browse files

Files changed (3) hide show

app.py +106 -0
data/acn_homepage_faiss_store_1000_tokens.pickle +3 -0
requirements.txt +5 -0

app.py ADDED Viewed

	@@ -0,0 +1,106 @@

+from typing import Dict
+import streamlit as st
+import pickle
+from langchain import OpenAI
+from langchain.prompts import PromptTemplate
+import os
+from langchain import OpenAI
+from langchain.chains.qa_with_sources import load_qa_with_sources_chain
+with open("data/key.txt") as f:
+    openai_key = f.read().strip()
+os.environ["OPENAI_API_KEY"] = openai_key
+@st.cache
+def get_docstore():
+    with open("data/acn_homepage_faiss_store_1000_tokens.pickle", "rb") as f:
+        store = pickle.load(f)
+    return store
+def init_chain():
+    question_prompt_template = """長い文書の次の部分を使って、質問に答えるために関連するテキストがあるかどうかを確認します。
+    関連するテキストがあれば、そのテキストを返す。なかったら、「関連情報なし」と返さないてください。
+    {context}
+    質問: {question}
+    関連するテキスト:"""
+    QUESTION_PROMPT = PromptTemplate(
+        template=question_prompt_template, input_variables=["context", "question"]
+    )
+    combine_prompt_template = """
+    あなたは、アクセンチュアのAIアシスタントです。
+    あなたには、以下のような長いドキュメントの抜粋部分と質問が与えられています。
+    提供されたテキストを参考して人間と会話するように答えてください。
+    提供されたテキストに根拠がない場合は、わからないと答えなさい。答えを捏造しないでください。
+    =========
+    テキスト：{summaries}
+    =========
+    質問: {question}
+    =========
+    答案:"""
+    COMBINE_PROMPT = PromptTemplate(
+        template=combine_prompt_template, input_variables=["summaries", "question"]
+    )
+    chain = load_qa_with_sources_chain(OpenAI(temperature=0),
+                                    chain_type="map_reduce",
+                                    return_intermediate_steps=True,
+                                    question_prompt=QUESTION_PROMPT,
+                                    combine_prompt=COMBINE_PROMPT,
+                                    verbose=True
+                                    )
+    return chain
+# format the result to markdown format
+def format_result_to_markdown(result: dict):
+    result_markdown = "# Source \n"
+    result_markdown += f"""
+# Answer
+{result["output_text"].strip()}
+    """
+    for i, intermediate_step in enumerate(result["intermediate_steps"]):
+        link = result["input_documents"][i].metadata["source"]
+        result_markdown += f"""
+**Link**: {link}
+**Extracted Information**: {intermediate_step}
+        """
+    return result_markdown
+if __name__ == "__main__":
+    st.title("ACN AIアシスタント(超爆速版※)")
+    st.subheader("質問に答えるために関連するテキストを検索します。")
+    st.text("※超爆速とは、開発スピードを指しています。Botの反応速度ではありません。")
+    st.markdown(
+        """
+## 質問の例：
+- アクセンチュアのAI領域のリーダは誰ですか？
+- アクセンチュアのCEOは誰ですか？
+- アクセンチュアの社長は誰ですか？
+- アクセンチュアの事業内容は？
+- アクセンチュアの事業所在地は？
+- アクセンチュア社員の有給は何日ありますか？
+        """
+    )
+    docsearch = get_docstore()
+    chain = init_chain()
+    question = st.text_input("質問を入力してください", "")
+    answer_slot = st.empty()
+    with st.spinner("答案を検索中..."):
+        if st.button("Submit"):
+            try:
+                query = question.strip()
+                docs = docsearch.similarity_search(query, k=3)
+                result = chain(
+                    {"input_documents": docs, "question": query},
+                )
+                answer_slot.markdown(format_result_to_markdown(result))
+            except Exception as e:
+                st.write(e)

data/acn_homepage_faiss_store_1000_tokens.pickle ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:eeebf41460e484e4129f8a4cebd866ec5e44545d6fd4ac207a3a1ecea34e6d28
+size 15033620

requirements.txt ADDED Viewed

	@@ -0,0 +1,5 @@

+langchain==0.0.58
+openai
+faiss-cpu
+streamlit
+streamlit-chat