File size: 5,532 Bytes
643bd7e
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
"""
这段代码的整体功能是创建一个Gradio应用,用户可以在其中输入问题,应用会使用Retrieval-Augmented Generation (RAG)模型来寻找答案并将结果显示在界面上。
其中,检索到的上下文会在Markdown文档中高亮显示,帮助用户理解答案的来源。应用界面分为两部分:顶部是问答区,底部展示了RAG模型参考的上下文。

结构概述:
- 导入必要的库和函数。
- 设置环境变量和全局变量。
- 加载和处理Markdown文档。
- 定义处理用户问题并返回答案和高亮显示上下文的函数。
- 使用Gradio构建用户界面,包括Markdown、输入框、按钮和输出框。
- 启动Gradio应用并设置为可以分享。
"""

import os

import gradio as gr
from dotenv import load_dotenv
from langchain.document_loaders import TextLoader

from rag_demo import load_and_split_document, create_vector_store, setup_rag_chain, execute_query

# 环境设置
load_dotenv()  # 加载环境变量
QUESTION_LANG = os.getenv("QUESTION_LANG")  # 从环境变量获取 QUESTION_LANG

assert QUESTION_LANG in ['cn', 'en'], QUESTION_LANG

if QUESTION_LANG == "cn":
    title = "LightZero RAG Demo"
    title_markdown = """
    <div align="center">
        <img src="https://raw.githubusercontent.com/puyuan1996/RAG/main/assets/banner.svg" width="80%" height="20%" alt="Banner Image">
    </div>
    <h2 style="text-align: center; color: black;"><a href="https://github.com/puyuan1996/RAG"> 🎭LightZero RAG Demo</a></h2>
    <h4 align="center"> 📢说明:请您在下面的"问题"框中输入任何关于 LightZero 的问题,然后点击"提交"按钮。右侧"回答"框中会显示 RAG 模型给出的回答。在QA栏的下方会给出参考文档(检索得到的 context 用黄色高亮显示)。</h4>
    <h4 align="center"> 如果你喜欢这个项目,请给我们在 GitHub 点个 star ✨ 。我们将会持续保持更新。  </h4>
    <strong><h5 align="center">注意:算法模型的输出可能包含一定的随机性。相关结果不代表任何开发者和相关 AI 服务的态度和意见。本项目开发者不对生成结果作任何保证,仅供参考。<h5></strong>
    """
    tos_markdown = """
    ### 使用条款
    玩家使用本服务须同意以下条款:
    该服务是一项探索性研究预览版,仅供非商业用途。它仅提供有限的安全措施,并可能生成令人反感的内容。不得将其用于任何非法、有害、暴力、种族主义等目的。
    如果您的游玩体验有不佳之处,请发送邮件至 [email protected] ! 我们将删除相关信息,并不断改进这个项目。
    为了获得最佳体验,请使用台式电脑,因为移动设备可能会影响可视化效果。
    **版权所有 2024 OpenDILab。**
    """

# 路径变量,方便之后的文件使用
file_path = './documents/LightZero_README.zh.md'
chunks = load_and_split_document(file_path)
retriever = create_vector_store(chunks)
# rag_chain = setup_rag_chain(model_name="gpt-4")
rag_chain = setup_rag_chain(model_name="gpt-3.5-turbo")

# 加载原始Markdown文档
loader = TextLoader(file_path)
orig_documents = loader.load()


def rag_answer(question):
    retrieved_documents, answer = execute_query(retriever, rag_chain, question)
    # Highlight the context in the document
    context = [retrieved_documents[i].page_content for i in range(len(retrieved_documents))]
    highlighted_document = orig_documents[0].page_content
    for i in range(len(context)):
        highlighted_document = highlighted_document.replace(context[i], f"<mark>{context[i]}</mark>")
    return answer, highlighted_document

"""
在下面的代码中,gr.Blocks构建了Gradio的界面布局,gr.Textbox用于创建文本输入框,gr.Button创建了一个按钮,gr.Markdown则用于显示Markdown格式的内容。
gr_submit.click是一个事件处理器,当用户点击提交按钮时,它会调用rag_answer函数,并将输入和输出的组件关联起来。
代码中的rag_answer函数负责接收用户的问题,使用RAG模型检索和生成答案,并将检索到的文本段落在Markdown原文中高亮显示。
该函数返回模型生成的答案和高亮显示上下文的Markdown文本。
"""
with gr.Blocks(title=title, theme='ParityError/Interstellar') as rag_demo:
    gr.Markdown(title_markdown)

    with gr.Row():
        with gr.Column():
            inputs = gr.Textbox(
                placeholder="请您输入任何关于 LightZero 的问题。",
                label="问题 (Q)")  # 设置输出框,包括答案和高亮显示参考文档
            gr_submit = gr.Button('提交')

        outputs_answer = gr.Textbox(placeholder="当你点击提交按钮后,这里会显示 RAG 模型给出的回答。",
                                    label="回答 (A)")
    with gr.Row():
        # placeholder="当你点击提交按钮后,这里会显示参考的文档,其中检索得到的与问题最相关的 context 用高亮显示。"
        outputs_context = gr.Markdown(label="参考的文档,检索得到的 context 用高亮显示 (C)")

    gr.Markdown(tos_markdown)

    gr_submit.click(
        rag_answer,
        inputs=inputs,
        outputs=[outputs_answer, outputs_context],
    )

if __name__ == "__main__":
    # 启动界面,设置为可以分享。如果分享公网链接失败,可以在本地执行 ngrok http 7860 将本地端口映射到公网
    rag_demo.launch(share=True)