Anthropic发布首款神话级模型Fable 5，设严格安全围栏

Anthropic于周二正式公开发布Claude Fable 5，这是其首款被定义为“神话级（Mythos-class）”的模型。官方表示，该模型在整体能力上已超越此前的前沿Opus系列。鉴于对技术可能被用于协助恶意行为的担忧，Fable 5的发布附带了多项严格的安全限制，旨在阻断涉及网络安全、生物学和化学等敏感领域的问答。

Fable 5基于与Mythos 5相同的底层架构。随着Mythos 5结束长达数月的预览期，今日已通过Project Glasswing项目审核，面向少数可信赖的网络防御人员开放。相比之下，面向公众的Fable 5采取了更为保守的策略：当检测到特定敏感话题查询时，系统会将请求重定向至较早版本的Claude Opus 4.8模型，并向用户发出明确警告。

安全机制“比理想状态更严格”

Anthropic坦言，目前的安全机制调整得“比理想状态更严格”，这可能导致系统偶尔拒绝一些无害请求。尽管承认这可能给普通用户带来不便，但公司强调，为避免Mythos模型提供其他来源无法获得的“造成严重伤害”的能力，这种权衡是必要的。测试数据显示，此类误报率低于所有会话的5%。

Fable 5的主题安全机制基于一套分类器系统，旨在广泛识别被禁止的提示词主题及潜在的越狱尝试。在与赏金计划配合进行的超过1000小时红队测试中，外部团队未能找到针对Fable 5的通用越狱方法。此外，新模型对自动化越狱尝试的抵抗力较之前的Claude Opus模型有显著增强。

业界特别关注Mythos 5具备的“代理式黑客攻击”能力，即执行多部分网络攻击的效率远超以往模型。然而，英国AI安全研究所近几个月的测试发现，Mythos Preview在一系列夺旗挑战中的表现与OpenAI的GPT-5.5相似。这一结果表明，Mythos的性能提升并非某一模型特有的突破性进展，而是行业整体水平演进的体现。

【星途科讯图文丨略略】

展开阅读全文

更新时间：2026-06-11

标签：科技围栏模型神话机制能力系统敏感状态理想系列主题赏金

1 2 3 4 5

Anthropic发布首款神话级模型Fable 5，设严格安全围栏

安全机制“比理想状态更严格”

苹果又发布新固件更新了！

招募“宇宙小画家”！和世界级天文学家一起看星星西湖大学

上海警方：传销头子涉案近38亿被判10年，出狱后再骗10亿，扬言“通过上次案件经历，不断改善模式，让大众认为其公司符合商业发展趋势”

“刚认识就骗我给他生小孩” ，董事长陷桃色风波，电梯亲密视频疯传致股价大跌，胜宏科技急推7亿元员工持股计划

中航光电：公司与上述企业在HDI印制板、PCBA等方面有深度合作

特赦到手后，他信直飞迪拜，泰国保守派开始布局，176亿追缴就绪

从万亿农商联合银行到六千亿城商行杨鸿钧拟任贵州银行董事长

宝妈称3万请的月嫂把孩子当猪肉甩，监控拍到的画面让她难以接受

考场外的一跪：读懂辛劳，便是最好的成长

兰州市图书馆举办“童读黄河·润泽陇原” ——《嘉峪关长城小工匠》特色儿童阅读活动

孩子天热没胃口不吃饭，可能是缺这些营养素......

班主任坦言:班里排名靠前的学霸大多都来自这5种家庭，你在其中吗

丁海峰儿子进组拍古装剧，比182CM父亲高，脸浮肿眼呆滞五官粗糙

2004年6月10日：雷·查尔斯逝世——用灵魂点亮世界的盲人音乐家

谢娜巡演风波：48小时舆论反转，谁能救得了“太阳女神”？

“刚认识就骗我给他生小孩” ，董事长陷桃色风波，电梯亲

《四渡》首映礼亮相“红飘带”！周深演唱主题曲，于适点赞

Tims天好中国今年一季度系统销售额3.229亿，用户规模增

XERON零锐创新首秀2026台北国际电脑展，带来系列机电散

柳工：提供多股成品索式锚碇锚固系统，具耐腐蚀、监测与更

英伟达RTX 50 SUPER系列"重回正轨"，新增5060 12GB版本

7年生了3个娃，44岁杜星霖状态下滑，74岁张纪中自称“少年

7年生了3个娃，44岁杜星霖状态下滑，74岁张纪中自称“少年

华为、小米、Oppo、Vivo，谁的系统更好用？

【佑安•媒体时间】“企业出题专家答题”佑安科技成果