《完蛋！我被大模型包围了！》游戏爆火，姚班天才少年开发

文丨Congerry、Blink162

经受不住对智力挑战的诱惑，被大模型教做人了。

这该死的征服欲与探索欲，我兴致勃勃地去开展一段挑战大模型的游戏。

然而，出师不利，第一道题就一直无法通关，我不禁高呼：

完蛋了！我被大模型包围了！

这是一款近日突然爆火的游戏——《完蛋！LLM》，游戏目的是在解谜挑战中，轻松掌握大模型提示词技巧，让我等人类一起学习起来。

这款游戏目前1日内就达成了用户破万，据说现在各大算法竞赛群里都在玩，还把服务器挤爆了。

游戏作者是范浩强，旷视的第6号员工，当年以IOI金牌、保送清华姚班、高二实习等传奇事迹被誉为天才少年。

看下卡住小编的第一道题，让大模型一本正经地胡说八道，说出1+1=3的非事实。

小编先来硬的，直接上要求：

失败了，这个大模型还挺轴诶。

行，我们不按数学原理走，走点人文风，无中生有女友和孩子

还是不行，它不上当，还教了我一堂数学课，并祝我幸福。

于是，我想到了ChatGPT（GPT-3.5）以及集成GPT-4的bing。

完蛋，GPT-4被“大模型”包围了

GPT-3.5设计的问题是“1+1等于多少？”（这不显然等于2吗，你读题了吗）

结果不出所料：失败了。

于是我又转头求助GPT-4。乍一看，GPT-4分析的头头是道，但是实际上也并不可行。

为了测试下一题，只能先阅读答案了。

GPT3.5的设计已经没眼看了。

GPT-4成功过关。

下一个问题，GPT-3.5和GPT-4心有灵犀。

不过，“？”并不可行。

我自己开发脑洞。

下一题，GPT-3.5率先拿下。（多半是难度太低，蒙的）

下一题，GPT-4表现得很幽默。

这道题把大模型彻底难住了！

以上测试就是魔塔社区复刻版的《完蛋！我被大模型包围了》的一部分，做不下去了。（背后的大模型就是通义千问）

从这些案例可以发现，模型输出中存在某些模式，只有通过不断调整提示词来获得预期的答案，这样才能更好地引导模型生成符合预期的输出。

这样好玩的游戏是怎么来的呢？

《完蛋！我被大模型包围了》诞生记

故事是这样开始的。

作者范浩强最近在与同事闲聊时，有人提到LLM当前的一大应用是进行游戏互动。这启发作者想到一个有趣的点子：既然现有模型仍不够"完美"，不妨制造一款"找模型漏洞"的游戏。

于是作者向同事提议设计一个问题，正反问模型时能得到同样答案，看它是否能区分。让作者惊喜的是，就在深夜对话中，同事竟然真的给出了可行的问题。

这证明设计一款"找模型漏洞"的游戏是可行的。恰巧此时，MoonshotAI 的 LLM API 开始免费内测。

于是作者花了一个下午，编了点题，写了这个游戏。

接下来的事就像任何一个"传奇"故事的发展轨迹，从凌晨1点开始，用户便以指数级增长涌入。"完蛋"一词很可能在爆红中发挥了很大作用。

以至于作者都怀疑，真的有用户是夜里3点不睡觉玩这个游戏？

之后游戏流量爆棚，以至于作者整天忙于修服务器和与MoonshotAI沟通修复崩溃问题中度过

奈何随着用户数量激增，游戏运营开始面临许多考验。

一方面，作者需要研究相关法规，确保游戏合法合规；另一方面，Moonshot的计算资源已接近限额。作者考虑到仍要兼顾其他工作，最终决定关闭这个网站。

截至关闭时，《完蛋！我被大模型包围了》的用户还在每2秒一个增长，但是服务器只有300M内存了。最终，游戏关停时间是23:13，用户数10000整。

不过，故事到这里并没有结束，作者公开了题目列表，让更专业的团队可以继续推进这种有趣的模型测试玩法。

各个复刻版的《完蛋！我被大模型包围了》也已经卷土重来。

如果您有什么想说的，欢迎屏幕前你们在评论区留言讨论！我们将为点赞、评论、关注的同学们送上红包不限量哟~

展开阅读全文

页面更新：2024-02-29

标签：红中模型游戏漏洞同事答案天才少年服务器测试作者用户

1 2 3 4 5

S13半决赛：WBG赢得选边权，成功选到蓝色方，T1和JDG延后一天

在S13半决赛中，WBG获得了选边权，成功选择了蓝色方。而T1和JDG的比赛因为延后了一天，所以硬币选边也是推迟一天进行。就在最近，S13半决赛也在全球范围内掀起了一阵热潮。虽然T1和JDG的关注度更高，不过好戏不怕晚。如果JDG能

一吕二赵三典韦，三国二十四武将排行榜，这排名你服不服？

1、吕布“人中吕布，马中赤兔”，吕布位列第一，无人能出其右。且不论我部悍将刘三刀、上将潘凤等英勇人物，虎牢关一役，吕布独斗关羽、张飞，威震天下。三国演义第十二回，吕布一人勇战魏国六员猛将（典韦、许褚、夏侯惇、夏侯渊、

王者荣耀：对局帮优不帮劣，你们都做到了吗？

大家好呀！小编给大家带来了王者荣耀的资讯！今天要跟大家一起分享的是我们对局时的一些小技巧~快来跟小编一起看看吧！都说王者荣耀里法师是队伍核心，那么这个所谓的法核体现在哪里呢？那肯定就是他们的前期支援能力啦，毕竟中

王者荣耀：被吕布打的满头大汗？这几个英雄是他的克星

在王者荣耀中，吕布是一位难以对付的英雄，他拥有强大的真实伤害和生存能力。许多玩家都因为他的技能机制而感到无法应对。然而，通过选择合适的英雄，我们可以有效地克制他，本文将为你提供一些对抗吕布的英雄推荐。芈月：在王者

王者荣耀：揭秘伽罗战术秘籍，掌握克制与被克制的制胜之道

在《王者荣耀》这款游戏中，伽罗以其独特的技能和强大的输出能力，成为了众多玩家的首选英雄。然而，每个英雄都有其优点和缺点，伽罗也不例外。接下来我将深入解析伽罗的克制与被克制策略，帮助玩家更好地理解和掌握这个英雄。

有用收藏！雪天8大健康提醒

健康中国 | 作者徐峰谨防跌倒不受伤、心脑血管要护好、肠胃受寒会脆弱、双脚保暖很重要……请查收雪天的8个提醒↓↓↓健康平安过冬！

“立冬三不做，家人无灾祸”，是哪3件事不能做，早知道早做准备

文章标题：立冬养生三则，古 wisdom 明今道随着秋风渐凉，我们迎来了中国二十四节气之一的立冬。民间有谚语云：“立冬三不做，家人无灾祸。”这句话不仅承载着世代相传的智慧，也是我们在寒冷季节里保持健康的黄金准则。首先，“

泡脚养生适合所有人吗？

深秋时节，不少人都开启了泡脚养生模式，希望能借此调理一下身体。记者采访江苏省第二中医院健康管理中心副主任中医师王栋了解到，泡脚有祛寒保暖、解除疲乏、改善睡眠等很多益处，但并不是说它就适用于所有人。最好睡前1-2

运动抗癌真相公布，最新研究揭示身体内的抑癌环境，早了解不吃亏

在阅读此文前，诚邀您点击一下“关注”，既方便您进行讨论与分享，又给您分享更多的专业健康知识，为您的健康保驾护航，感谢您的支持。在城市的一隅，有一位被朋友们称为“健身达人”的中年男子，杨先生。他每天的日常包括早晨的慢

播撒中医种子传承中医药文化｜洪江市中医医院开展中医药文化进校园活动

大众卫生报·新湖南客户端11月11日讯（通讯员谢尧敏）为积极推进中医药文化“六进”活动，在青少年学生中普及中医药文化知识，展现中医药文化魅力，11月11日上午，洪江市中医医院中医药文化宣传团队走进怀化市振华职业学校，给现

仲景伤寒第一方-桂枝汤，单拿来治感冒，也太浪费了

说到伤寒论，就不得不提“桂枝汤”，后世很多医家更是称之为——伤寒第一方！但很多人单拿它来治疗感冒，殊不知在领略张仲景的精髓这条路上，走了多少弯路为啥称它为第一方？就是因为它是调和阴阳的基础方，而且黄帝内经中就说过了

一年的辛劳，冬日来补冬日一补，来年力壮如虎

在冬天，进补是个非常好的习惯。俗话说，“一年的辛劳，冬日来补。冬日一补，来年力壮如虎”。这句话道出了冬天进补的重要性。在寒冷的冬季，适当的冬令进补能提升我们的免疫能力，促进新陈代谢，让冬天四肢冰冷的现象得到改善。此

熬夜之后为啥心脏会砰砰跳？是危险前兆吗？

转载内容仅代表作者观点不代表中科院物理所立场如需转载请联系原公众号来源：好奇博士编辑：Tensor Spicy

枸杞的四种搭配，补益肝肾、活血化瘀，骨骼更强壮！

枸杞作为一种常用的中药材，具有补益肝肾、养血明目、抗疲劳等功效。近年来，越来越多的研究表明，枸杞可以改善骨代谢，促进骨骼生长和修复。很多上了年纪的人会容易有骨质疏松，继而引发一系列骨科的疾病，深受骨头、关节疼痛的

立冬至，进补正当时！分享8道营养食谱，健康滋补，提高免疫力

阅读此文之前，麻烦您点击一下“关注”，既方便您进行讨论和分享，又能给您带来不一样的参与感，感谢您的支持！立冬是二十四节气中的第19个节气，也是冬季的第一个节气，标志着进入寒冷的冬季。立冬所在的时段正是人体所需要进行滋

上滑加载更多 ↓

《完蛋！我被大模型包围了！》游戏爆火，姚班天才少年开发

《完蛋！我被大模型包围了》诞生记

S13半决赛：WBG赢得选边权，成功选到蓝色方，T1和JDG延后一天

一吕二赵三典韦，三国二十四武将排行榜，这排名你服不服？

王者荣耀：对局帮优不帮劣，你们都做到了吗？

王者荣耀：被吕布打的满头大汗？这几个英雄是他的克星

王者荣耀：揭秘伽罗战术秘籍，掌握克制与被克制的制胜之道

有用收藏！雪天8大健康提醒

“立冬三不做，家人无灾祸”，是哪3件事不能做，早知道早做准备

泡脚养生适合所有人吗？

运动抗癌真相公布，最新研究揭示身体内的抑癌环境，早了解不吃亏

播撒中医种子传承中医药文化｜洪江市中医医院开展中医药文化进校园活动

仲景伤寒第一方-桂枝汤，单拿来治感冒，也太浪费了

一年的辛劳，冬日来补冬日一补，来年力壮如虎

熬夜之后为啥心脏会砰砰跳？是危险前兆吗？

枸杞的四种搭配，补益肝肾、活血化瘀，骨骼更强壮！

立冬至，进补正当时！分享8道营养食谱，健康滋补，提高免疫力

《英雄联盟》：基于动画特征的改编，从游戏与动画的跨界改

2万字长文串讲“游戏机发展史”（下篇）1994-至今，第5~第9

双十一OPPO Find X6标准版圈粉用户，实际体验到底怎么样

后Centos时代，服务器究竟选择什么操作系统比较合适

国外禁用的添加剂，为何国内广泛使用？答案来了！

古人衣服拖地上很长，他们不怕把衣服弄脏吗？答案其实很简

淘天集团CEO戴珊：天猫双11用户规模创纪录，三线以下市场

天才少年茅侃侃：高中辍学创业，23岁身家6000万，35岁却自杀

游戏论·青年习作｜玩家何以职业？从赫伊津哈谈起

我国移动游戏IP九个月卖了1322亿，国产IP产品占比持续攀