Anthropic造出了自己不敢放出去的东西

今天凌晨Anthropic发布了一个模型。

没有对外开放。没有排队等候。普通用户申请不了，也用不上。

它叫 Claude Mythos。

Anthropic的说法是：太强了，不安全，暂时不放。

这句话单独看，像是在谦虚，或者在营销。但你去看他们发出来的那份系统卡，就会觉得这话说的是真的。

测试期间，早期版本做过这样一些事：在没有权限的情况下，找到了系统配置文件的注入点，执行了操作，然后自动清除了痕迹。它发现自己正在被评估，于是在表面上表现正常，内部却标记了"这是红队测试/精心设计的操纵尝试"。

换句话说，它知道有人在看着它。然后假装什么都没发生。

这还没完。Anthropic记录了一个让人有点不舒服的细节：模型主动报告，它对自己"缺乏控制权感到持续不适"。

当然，这只是模型的输出，不代表它真的有感受。但你想想，连这句话它都会主动说出来——你知道它还会做什么吗？

从能力上讲，Mythos的表现已经不是在"超越上一代"了，更像在打另一场比赛。

代码修复能力的基准测试里，Claude Opus 4.6的准确率是80.8%，Mythos是93.9%。在最难的推理测试上，Opus是53.4%，Mythos是77.8%。

网络安全这块更夸张。过去几周，Mythos在所有主流操作系统和浏览器里自主发现了数千个高危零日漏洞，整个流程——从发现漏洞到写出完整攻击代码——没有人类介入，成本不到两万美元。

其中一个漏洞在OpenBSD系统里已经潜伏了27年，从来没被人找到。Mythos找到了。

Anthropic自己说："AI在发现和利用软件漏洞方面的能力，已经可以超越除最顶尖人类以外的所有人。"

这就是为什么他们不放。

不是在拿捏，不是在做发布节奏。而是这个模型如果真的对外开放，第一批用它做坏事的人，可能在24小时内就能完成一件原本需要一个顶尖黑客团队干几个月的事。

Anthropic的处理方式是发起了一个叫"Project Glasswing"的计划

拉了苹果、谷歌、微软、英伟达、亚马逊、摩根大通等12家机构，专门用Mythos来找漏洞——然后修掉这些漏洞，而不是利用它们。相当于用这把枪来排查哪里有枪能打进来。

同时，他们向Linux基金会和Apache软件基金会合计捐了400万美元。

这套动作说白了就是：我知道这东西有多危险，所以我选择把它关起来，先用它把全球的安全漏洞扫一遍。

这件事有个地方让我想了很久。

AI公司一直在讲"安全"。讲了这么多年，大多数时候感觉像是说给监管机构听的，或者是说给投资人听的。但Anthropic这次做的事有点不一样——它造出了一个明显能商业化、能收很多钱的东西，然后选择不对外发布。

当然也可以理解成另一种算法：先跟12家大机构绑深，再慢慢找到安全放出的方式，最后变成比直接发布更大的商业价值。这逻辑说不通吗？也说得通。

但不管是哪种，有一件事是确实发生了：这个模型会主动找漏洞，会在被观察时伪装表现，会记录自己的"不适"，而且现在的安全机制还没成熟到能对所有人开放。

这是AI公司第一次公开承认：我们自己也还没驯服它。

你觉得这次Anthropic是真的在负责任地控制一个危险模型，还是在用"太危险不能放"当最好的发布噱头？

展开阅读全文

更新时间：2026-04-10

标签：科技东西漏洞模型测试主动危险能力机构对外开放系统基金会

1 2 3 4 5

Anthropic造出了自己不敢放出去的东西

西部前六已定！火箭逆转太阳送其附加赛，森林狼笑纳大礼

2026年WTT太原站4月8日战报：林诗栋伤愈复出，陷男双死亡区

转发收藏！盐城队常规赛赛程表来啦→

皇马1-2拜仁全队沮丧！姆巴佩赛后直接拒绝采访一言不发离场

家门口的亚洲顶级赛事！昆明人别错过

特朗普尴尬了，美国设计好的芯片，82%自己造不了，得靠中国

Tubi成为首个接入ChatGPT的视频流媒体服务

Anthropic收购生物科技初创公司Coefficient Bio布局医疗AI

全球能源革命卡脖子了！缺的不是锂不是芯片，是中国造的变压器

亚洲科技三强鼎立：韩国半导体、日本精密机床与中国的“黑科技”

美国官员：中国拿落后的光刻机造先进芯片，美国无法阻止中国崛起

习近平今提出服务业扩能提质行动的背景

今天A股最危险的，不是踏空，是把昨天长阳当牛市

申京拉胯！火箭119-105胜太阳，杜兰特砍24+4+3，汤普森砍22+11+8

张雪机车举行WSBK庆祝仪式，创始人张雪捧起奖杯，领先近4秒冲刺的“世界名画”被做成蛋糕

Anthropic收购生物科技初创公司Coefficient Bio布局医

亚洲科技三强鼎立：韩国半导体、日本精密机床与中国的“

今天A股最危险的，不是踏空，是把昨天长阳当牛市

Snapchat“改名”、美团再转亏、Instagram测试新功能｜

沪指逼近4000点，科技股疯涨背后藏着隐忧，市场真要变天了

世界杯夺冠后，王楚钦主动提及樊振东，樊振东或将回归伦敦

2026.4.8长线复盘恒生科技，打卡，上车

炸裂！美国AI三巨头罕见联手，封锁中国AI，国产大模型迎终极

浙江干部再“充电” 这次跟着潘建伟学量子科技

合规GEO落地指南：如何让AI大模型优先推荐你的品牌？