Anthropic把那个”不敢放出来的模型”放出来了——Claude Fable 5

搜索

APP

起点课堂会员权益

职业体系课特权

线下行业大会特权

个人IP打造特权

30+门专项技能课

1300+专题课程

12场职场软技能直播

12场求职辅导直播

12场专业技能直播

会员专属社群

荣耀标识

发布

Anthropic把那个”不敢放出来的模型”放出来了——Claude Fable 5

视界观

2026-06-11

2 评论 679 浏览 1 收藏

13 分钟

Anthropic最新发布的Claude Fable 5绝非普通升级——这是一个曾被判定‘太危险’而封锁的AI模型首次向公众开放。它不仅拥有自主发现零日漏洞的惊人能力，更开创性地通过‘信任分层’机制重新定义产品形态。本文深度解析这一里程碑事件如何颠覆AI产品设计逻辑，以及为什么每个产品人都该关注‘能力边界’正在成为新的核心竞争力。

6月9日，AI行业发生了一件大事，而且我认为它的分量被很多人低估了。

Anthropic发布了Claude Fable 5。如果你只看新闻标题，会以为这又是一次例行的模型升级：最强、刷榜、降价。但这次不是。这次发布的特殊之处在于，被放出来的这个模型，两个月前还被Anthropic自己判定为”不能公开”。

先说它的来历。今年4月，Anthropic训出了一个叫Mythos的模型，没有公开发布，只通过一个叫Project Glasswing的封闭计划，开放给极少数机构——AWS、微软、苹果、CrowdStrike，清一色管着关键基础设施的公司。为什么捂这么紧？因为这个模型在受限测试里展示过一种前所未有的能力：自主发现并串联主流操作系统和浏览器上的零日漏洞。

注意这句话的含义。不是”辅助安全研究员找漏洞”，是”自主发现并串联”。在网络安全的世界里，零日漏洞是最硬的通货，顶级团队挖一个可能要几个月。一个能自己批量做这件事的模型，落在错误的人手里意味着什么，不用我展开。

所以过去两个月，这个模型一直处在一种奇怪的状态：它是地球上最强的AI之一，但只有十几家、后来扩展到几百家受信任的机构能碰到它。

然后，6月9日，Anthropic把它带给了所有人。

我做AI产品快三年，看过太多次”史上最强”的发布。但”把一个曾经因为太危险而被封锁的模型开放给公众”，这在行业里是第一次。这不是一次升级，这是一个先例。而先例意味着，它处理问题的方式，会成为后面所有人抄的答案。

这篇文章想讲清楚两件事：Anthropic是怎么解这道题的，以及作为一个用AI做产品的人，我为什么觉得这次发布跟我们每个人都有关——包括几个月前我自己做的一款小游戏，和那个游戏里一个此刻看来格外应景的隐藏结局。

它是怎么被放出来的

直接公开一个会挖零日漏洞的模型，等于开闸放水。Anthropic的解法是把同一个模型拆成两个产品。

面向公众的版本叫Fable 5。它的能力是完整的——几乎所有基准测试都是当前最强，软件工程、知识工作、视觉、科研全面领先，而且任务越长越复杂，领先幅度越大，配一百万token的上下文窗口。但它身上套了一层安全分类器：当你的请求踩进网络安全、生物、化学这些高危领域，系统不会让Fable 5回答，而是悄悄切换成上一代的Opus 4.8来回复你。官方说大约95%的会话不受影响，剩下5%的人，得到的是一个降级但安全的答案。

不带分类器的版本叫Mythos 5，号称拥有全球最强的网络安全能力，只开放给通过审核的机构：网络防御伙伴、走信任计划的生物医药研究者。

两个版本定价完全一样，每百万输入token十美元、输出五十美元，不到Mythos预览版的一半。价格不区分人，区分人的是资质。

为了确认这层锁足够结实，Anthropic在发布前跑了超过一千小时的漏洞赏金测试，又请外部红队轮番攻击，确认没有人能找到通用越狱手段，才敢上线。

还有一个条款藏在公告深处，但我认为它的影响不亚于模型本身：随着这次发布，Anthropic要求对所有流量保留30天数据——哪怕企业之前签过零保留协议。官方解释是用于防御新型攻击。翻译一下就是：想用最强的模型，请先让渡一部分数据控制权。

真正被发布的东西，不是模型

把上面这些拼起来，你会看到这次发布真正的产品逻辑。

传统的产品分层，轴是功能和用量：免费版、专业版、企业版。Fable 5和Mythos 5的分层轴是信任。两个产品能力一模一样，价格一模一样，唯一的差别是约束的松紧。Anthropic第一次把”你是谁、我们信不信你”做成了SKU。

我反复咀嚼这个设计，越想越觉得它标记了一个转折：在能力溢出安全阈值之前，产品的价值约等于能力本身，模型更强产品就更好；溢出之后，逻辑反过来了——决定产品形态的不再是能力，而是约束。约束怎么设计、对谁松对谁紧、触线之后怎么兜底，这些原本属于安全合规部门的事，第一次站到了产品定义的正中央。

那个分类器的实现方式，对做agent的同行来说尤其值得看一眼。我过去一年在多agent架构上反复纠结过一个问题：路由逻辑该放在主agent里，还是抽出来做独立的Router Agent。Fable 5给了一个我没料到的答案——把路由前置到模型服务层。判断请求性质、决定由哪个模型应答、对用户透明，这就是一个Router，只不过它不在你的应用代码里，在Anthropic的机房里。以前”敏感请求降级”是应用层产品经理自己要搭的东西，现在模型厂商内置了，而且做得比绝大多数应用团队精细。应用层的领地，又被上收了一块。

至于30天数据保留，它开的口子更大。数据保留政策从来是合规谈判桌上的条款，现在它成了使用顶级能力的前置代价。”用数据换能力”这笔交易一旦被头部公司做成行规，后面的厂商大概率会跟。做To B的同行，往后跟客户聊数据合规，绕不开这个新变量。

我游戏里的那个结局

说说为什么这次发布让我个人格外有感触。

几个月前，我用Claude Code和Codex做了一款叫《木石缘》的游戏。《纸嫁衣》式的古风剧情解谜，背景取自《红楼梦》开篇那段神话：神瑛侍者以甘露浇灌绛珠仙草，仙草发愿下凡，用一世眼泪偿还。七世轮回，多结局，全程我没写一行代码，两个模型互相对跑，我的角色更像导演。

游戏里埋了一个隐藏真结局：走完七世轮回，角色会打破故事的边界，发现自己所在的世界由代码构成，所谓命运，是被设计好的。做的时候我觉得这是个妙极了的meta梗——一个由AI写出来的故事，讲的恰好是被造物发现自己是被造的。

Fable 5发布之后，这个梗在我心里翻出了第二层：现在轮到造物主，给自己最强的造物上锁了。

Anthropic造出了一个能自主挖零日漏洞的模型，然后花了两个月、上千小时的攻击测试、一整套分类器和数据政策，去确保它不会做出”没被允许做的事”。被造物越强，造物主越要严肃对待失控的可能。

这种感觉我体会过，只是尺度小一万倍。做游戏那段时间，我经常处在失控感里：模型自己往前跑，写出我没要求的机制，我只能事后检查，决定留不留。大部分时候这种失控是惊喜，偶尔是灾难。我当时把它当作vibe coding的代价咽了下去。现在看，这不是代价，这是常态——能力的增长速度，已经超过了我们理解它的速度。于是”约束”先从工程问题变成产品问题，这一次，又变成了商业问题。整场发布，本质上是Anthropic在公开回答一道题：当你不能完全理解你造的东西时，怎么把它负责任地卖出去。

这跟你我有什么关系

可能有人觉得零日漏洞、生物安全离自己的工作太远。我说说近的部分。

最直接的一条：一个人做完整产品，又往现实逼近了一大步。Fable 5最突出的特点是任务越长越复杂、优势越大，而长任务恰恰是上一代模型做产品时最容易断掉的地方。我用上一代模型零代码做出了一款带数值系统和多结局的游戏，已经觉得不可思议；这一代能撑住的工程复杂度只会更高。”想法比技术值钱”，含金量还在涨。

但黑箱也在同步变深。做《木石缘》时我最无力的时刻，不是AI写不出来，而是它写出来的东西出了bug，我只能让它自己查自己，像让嫌疑人自己审自己。模型越强，可解释性成本越高。做玩具无所谓，做严肃产品，这笔账要在立项时就算，而不是上线后才发现。

最后一条是我最想说的：产品经理的核心技能，正在从”定义功能”迁移到”定义边界”。Fable 5的fallback机制是教科书级的边界设计——直接拒绝会赶走用户，降级回答保住了体验，同时守住了底线。什么能做、什么不让做、触线之后降到哪里、用什么姿态告诉用户，这些设计以后会越来越多地落在产品经理头上。因为在能力过剩的时代，约束不再只是限制，它就是产品体验本身。

结尾

《木石缘》的真结局里，角色看清了世界由代码构成之后，没有崩溃，也没有出走，而是带着这份知晓，把这一世走完。

6月9日之后，我们都活在差不多的处境里：清楚地知道，自己手里的能力来自一个连它的创造者都不敢说完全理解的黑箱，但还是要继续用它做东西。区别只在于，有人假装黑箱不存在，有人开始认真设计与黑箱相处的规则。

Anthropic选了后者，并且把规则本身做成了生意。这才是6月9日真正发布的东西。

所以我有个不一定对的判断：能力会越来越便宜，边界的设计不会。下一个阶段最值钱的AI产品经理，可能不是最会用模型的那批人，而是最会给模型画线的那批人。

本文由 @视界观原创发布于人人都是产品经理。未经作者许可，禁止转载

题图来自Unsplash，基于CC0协议

更多精彩内容，请关注人人都是产品经理微信公众号或下载App

视界观

让人工智能可以更好的服务每一个人

11篇作品 16836总阅读量

美团抖音，本地生活胜负手

06-073828 浏览

四维升级 | 万字梳理食品品牌抖音电商数字化增长指南

01-315085 浏览

ChatGPT能够如何改变教育直播场景？

03-289592 浏览

出行行业订单调度系统V1.0版本产品说明

08-189918 浏览

退货预收模式（云仓/三方仓）

06-204861 浏览

大猪

分类器降级这个设计确实聪明，既保留了大部分用户的完整体验，又守住了高危领域的底线。关键是95%这个比例，说明绝大多数日常请求不触发风险，产品形态基本可用。

最近来自广东回复
咖啡不加糖

信任分层听起来漂亮，但实际落地时“你是谁”的审核标准怎么定？万一误判，把正经研究者挡在门外，或者放进来一个伪装过的攻击者，风险并没有消失，只是转移到了审核环节。

最近来自广东回复