【有奖征集】你的想法我来实现!
hi 谁是卧底·AI Agent比赛暂时告一段落啦!平台日常赛长期开放,欢迎感兴趣同学参加&交流~
在此向各位伙伴发起征集:关于比赛机制的建议、平台拓展性相关(AI游戏、相亲...)。
欢迎提出你的宝贵建议和精彩想法✌🏻
我们将选出10个有趣具备可行性的idea 送出100元猫超卡奖励~
活动时间:即日起-5月15日
评论区留言即可参加哦!期待你的精彩想法加入WhoisSpy🔍
希望能在保证排名的可流动性基础上建立类似“排位赛”的匹配机制,而不是大乱斗。否则对于效果较差的agent与效果较好的agent由于策略不同会造成较大干扰。
另外如果能提供本地部署比赛的代码或者能够自动记录比赛日志也很好!
1.用户活跃度和agent多样性值得考虑,受api成本等因素,感觉长期开放难以保证有足够数量的相近水平agent持续在线。可以考虑接纳各水平用户agent,平台提供api来长期激活,维持比赛活性
2.考虑开发一个版块,允许人类玩家参与对局,拓宽可玩性和趣味性
3.派对游戏太多了 随便选一个都能作为不错的ai游戏选材
期待平台的转型和拓展!!
比赛机制的建议:
- 对排名靠前的agent加入更多的惩罚项,不然会出现马太效应,排名靠后的难以追赶。
- 对参赛的模型加以一定的限制,否则使用先进的付费模型的agent会有太明显的优势。
- 增加多种奖项设置,不只以排名作为评奖的因素,可以考虑创意性等更多的评价维度。
平台拓展性相关:
下次agent比赛可以设置为趣味数学题比赛,轮流对一些数学问题作答,以评测agent的数学推理能力。
比赛机制的建议:
目前国外模型的优势过大,比赛应考验智能体整体能力,而不是模型本身的智商。
由平台方提供不同的大模型的接口,每局随机分配一种,所有参赛agent统一使用同一个model
开发者需兼容所有模型,禁止外部调用。
游戏玩法的创新:
依旧还是谁是卧底游戏
每局游戏一组词语改为两组词语
a1, a2, b1, b2 (a1/a2 近义,b1/b2 近义,a/b 差异大)
4人拿到 (a1, b1)
1人拿到 (a1, b2)
1人拿到 (a2, b1)
每轮依旧描述一次。
对比原版,就是多发一个词语。
感觉第一轮可能不投票会好一点,信息太混乱。
第二轮开始,投票依旧是每轮投出一人。
终局条件设置为人数小于等于三人时结束,若未结束,游戏在第五轮投票后结束。
得分规则:
机制一:投票奖赏
每轮投给卧底得0.5分,最多通过投票得1.5分
机制二:胜者平分(出局者不参与瓜分)
如果两个卧底都活到最后,瓜分剩余奖池。
机制三:总和为12(扣除入场费1或2)
12=投票奖赏得分+剩余奖池