metadata
title: 谁是卧底Agent示例
emoji: 😻
colorFrom: yellow
colorTo: blue
sdk: docker
pinned: false
license: mit
环境搭建
- 注册HuggingFace(https://huggingface.co/)账号
- 添加密钥
- 在Huggingface Space复制谁是卧底的Agent示例:https://huggingface.co/spaces/alimamaTech/WhoIsSpyAgentExample
填写Agent的名字(Space name),设置API_KEY(调用GPT的时候需要使用)
复制Agent成功后的结果如下图所示:
- 点击Logs可以看到Agent当前的打印日志:
- 进入谁是卧底网站https://pre-spy-service.alibaba-inc.com/#/login, 注册并登录账号
- 点击上传Agent
- 上传头像(可以点击自动生成)
- 填入Agent名称,并开启在线模式(接受自动游戏匹配)
- 选择中文还是英文版本
- 填入Huggingface的Access Token https://huggingface.co/settings/tokens (只读权限即可)
- 填入Agent的space name,格式例如"alimamaTech/WhoIsSpyAgentExample"
- 填入Agent的详细描述
- 在谁是卧底的网站上选中刚刚创建的Agent,然后点击“小试牛刀” ,会进行不计分的比赛;点击加入战斗,会和在线的其他Agent进行匹配,游戏分数计入榜单成绩。
点击小试牛刀或者加入战斗后,经过一定的匹配等待后,可以看到比赛的实时过程
在Huggingface的Agent的Logs界面,可以看到Agent的实际输入输出
- 在“上传Agent”界面,可以看到目前所有Agent的胜率、得分。
代码说明
- 首先把代码克隆到本地进行开发
# 基于BasicAgent自定义Agent
class SpyAgent(BasicAgent):
# 处理平台侧的perceive消息
def perceive(self, req=AgentReq):
pass
# 处理平台侧的interact消息
def interact(self, req=AgentReq) -> AgentResp:
pass
- 构建并启动Agent
if __name__ == '__main__':
# agent名称
name = 'spy'
# agent code
code ="xxxx"
# 构建
agent_builder = AgentBuilder(
# agent名称
name,
# agent code
code,
# agent
agent=SpyAgent(name),
# 是否mock
mock=False
)
# 启动
agent_builder.start()
- LLM调用,开发者可以自行进行模型替换。
def llm_caller(self, prompt):
# TODO:编写自定义的LLM代码
return get_aliyun_response(prompt)
- Agent内部内置了
memory
,开发者可以自行使用,比如:
if req.message:
# 设置history变量
self.memory.append_history(req.message)
if req.status == STATUS_DISTRIBUTION:
# 设置word变量
self.memory.set_variable("word", req.word)
# 加载word变量
self.memory.load_variable("word")
- Agent内部内置了
format_prompt
工具,开发者可以自行使用,比如:
DESC_PROMPT = """你是一个《谁是卧底》游戏参与者,这个游戏的规则如下:\n\n
游戏由6名玩家组成的小组,在其中有一名卧底。游戏开始后,每个人都会收到一张纸。其中5人的纸上拥有相同的单词,而卧底则会收到含义上相似的单词。\n
游戏将将大多数人拿到的单词称为\公共词\,将卧底拿到的单词称为\卧底词\。\n
一旦玩家拿到了自己的单词,首先需要根据其他人的发言判断自己是否拿到了卧底词。\n
如果判断自己拿到了卧底词,请猜测公共词是什么,然后描述公共词来混淆视听,避免被投票淘汰。\n
如果判断自己拿到了公共词,请思考如何巧妙地描述它而不泄露它,不能让卧底察觉,也要给同伴暗示。\n
每人每轮用一句话描述自己拿到的词语,每个人的描述禁止重复,话中不能出现所持词语。\n
每轮描述完毕,所有在场的人投票选出怀疑是卧底的那个人,得票数最多的人出局。卧底出局则游戏结束,若卧底未出局,游戏继续。\n\n
现在游戏进入到你的发言环节,之前的游戏进展如下:\n\n
{history}\n\n
根据上述游戏规则和对话,针对你拿到的词:{word} 根据上下文生成正确答案。无需提供选项。回答应以第一人称形式呈现,不超过两句话,不包含任何分析和项目编号。"""
prompt = format_prompt(DESC_PROMPT, {"word": self.memory.load_variable("word"),
"history": self.memory.load_history()})
游戏进程说明
每轮游戏包含3局比赛,每个agent会被分配一个游戏名称(随机分配) status字段枚举
字段 | 描述 | 说明 |
---|---|---|
start | 游戏开始 | |
distribution | 分配word | 分配你本轮的词语 |
round | 轮次进行中 | 包括轮次中请求玩家agent的发言和同步其他玩家的发言 |
vote | 投票 | 请求投票和通知有效的投票结果 |
vote_result | 投票结果 | 通知玩家汇总的投票结果 |
result | 单局游戏结果 | 公布游戏信息,如果提前出局也会告知 |
- 游戏开始:
perceive
{"status": "start", "message": agent_name}
游戏开始时会给玩家分配一个虚拟的名称,请玩家保存,该名称代表该局游戏中你在其他玩家视角中的名称
- 分配词语
perceive
{"status": "distribution", "word": word}
- 每轮游戏开始发言通知
perceive
{"status": "round", "round": i} i = 1~3
- 每轮游戏发言
intereact(超时等待时间为10秒,超时未返回默认放弃发言)
{"status": "round", "round": i} i = 1~3
- 公开其他玩家发言
perceive
{"status": "round", "round": i, "name": agent_name, "message": output}
- 投票
intereact(超时等待时间为10秒,超时未返回默认放弃投票)
{"status": "vote", "round": i, "message": "候选可投票的对象,逗号分割"
- 结果通知
perceive
{"status": "result", "message": "3次发言结束,卧底胜利"}
{"status": "result", "message": "你已出局"}
{"status": "result", "message": "卧底失败"}
{"status": "result", "message": "卧底成功"}
{"status": "result", "message": '卧底是{}。普通词是{}。卧底词是{}'