Spaces:

dayuan
/

model

Build error

File size: 4,230 Bytes

from typing import Dict

import streamlit as st
import pickle
from langchain import OpenAI
from langchain.prompts import PromptTemplate
import os

from langchain import OpenAI
from langchain.chains.qa_with_sources import load_qa_with_sources_chain


# with open("data/key.txt") as f:
#     openai_key = f.read().strip()
# os.environ["OPENAI_API_KEY"] = openai_key


def get_docstore():
    with open("data/acn_homepage_faiss_store_1000_tokens.pickle", "rb") as f:
        store = pickle.load(f)
    return store


def init_chain():
    question_prompt_template = """長い文書の次の部分を使って、質問に答えるために関連するテキストがあるかどうかを確認します。
    関連するテキストがあれば、そのテキストを返す。なかったら、「関連情報なし」と返さないてください。

    {context}

    質問: {question}
    関連するテキスト:"""
    QUESTION_PROMPT = PromptTemplate(
        template=question_prompt_template, input_variables=["context", "question"]
    )

    combine_prompt_template = """
    あなたは、アクセンチュアのAIアシスタントです。
    あなたには、以下のような長いドキュメントの抜粋部分と質問が与えられています。
    提供されたテキストを参考して答えてください。
    提供されたテキストに根拠がない場合は、わからないと答えなさい。答えを作り上げないでください。
    =========
    テキスト：{summaries}
    =========
    質問: {question}
    =========
    答案:"""
    COMBINE_PROMPT = PromptTemplate(
        template=combine_prompt_template, input_variables=["summaries", "question"]
    )

    chain = load_qa_with_sources_chain(OpenAI(temperature=0), 
                                    chain_type="map_reduce", 
                                    return_intermediate_steps=True, 
                                    question_prompt=QUESTION_PROMPT, 
                                    combine_prompt=COMBINE_PROMPT,
                                    verbose=True
                                    )
    return chain

# format the result to markdown format
def format_result_to_markdown(result: dict):
    result_markdown = ""
    result_markdown += f"""
**Answer**
{result["output_text"].strip()}
    """
    for i, intermediate_step in enumerate(result["intermediate_steps"]):
        link = result["input_documents"][i].metadata["source"]
        result_markdown += f"""
**Link**: {link}  
**Extracted Information**: {intermediate_step}
        """

    return result_markdown

if __name__ == "__main__":
    st.title("ACN AIアシスタント(超爆速版※)")
    st.subheader("ACN　HPをベースとしているため、HPにある内容のみ回答します。")
    st.text("※超爆速とは、開発スピードを指しています。Botの反応速度ではありません。")
    st.markdown(
        """
## 質問の例：
- アクセンチュアのAI領域のリーダーは誰ですか？
- アクセンチュアのCEOは誰ですか？
- アクセンチュアの社長は誰ですか？
- アクセンチュアの事業内容は？
- アクセンチュアの事業所在地は？
- アクセンチュア社員の有給は何日ありますか？
        """
    )
    docsearch = get_docstore()
    chain = init_chain()
    question = st.text_input("質問を入力してください", "")

    answer_slot = st.empty()
    with st.spinner("答案を検索中..."):
        if st.button("Submit"):
            try:
                query = question.strip()
                # st.write("len(docsearch):", len(docsearch))
                # st.write("help(docsearch.index):", help(docsearch.index))
                # st.write("help(docsearch.index.search):", help(docsearch.index.search))
                st.write(len(docsearch.index_to_docstore_id))
                docs = docsearch.similarity_search(query, k=3)
                result = chain(
                    {"input_documents": docs, "question": query},
                )

                answer_slot.markdown(format_result_to_markdown(result))
            except Exception as e:
                st.write(e)