卡帕西不是去训练新模型的——他要用 Claude 造下一个 Claude

0 评论 63 浏览 0 收藏 20 分钟

OpenAI创始成员卡帕西突然加入竞争对手Anthropic,这绝非普通跳槽事件。当企业AI市场份额首次逆转之际,这位AI教育布道者与专注Wrapper战略的Anthropic产生了惊人共鸣——他们都坚信套壳才是产品的未来。从vibe coding到模型自训练革命,这场人才流动背后隐藏着AI应用层最关键的范式转变。

OpenAI 的创始成员卡帕西,加入了 OpenAI 最大的竞争对手 Anthropic。

这不是一个跳槽八卦。背后是过去两年 AI 行业最大的一次转向,只是大多数人还没意识到。

为什么我说这件事不普通?

因为上个月(2026 年 4 月),Anthropic 在美国企业市场的份额首次反超 OpenAI——34.44% 对 32.3%。三年前,Anthropic 的份额只有 0.03%。

数据来源:Ramp 企业 AI 采纳指数,覆盖 5 万多家美国企业的真实消费

一个 OpenAI 的创始成员,在这个时间点去了 OpenAI 最大对手的模型公司。为什么是这个时间点?为什么是 Anthropic?

带着这两个问题,先认识一下这个人。

一、卡帕西是谁

如果你在 AI 圈,这个名字你肯定听过。如果刚入门,我用一句话告诉你:他是现代 AI 教学的 GOAT,AI 教学的布道者。

履历清单:

  • OpenAI 创始成员
  • 特斯拉前 AI 总监
  • 斯坦福读博时的导师是李飞飞

时间线(点位密集,慢看):

关于 2024 年 2 月那次离职:

时间点参考:Altman 2023.11 短暂被罢免后火速回归,卡帕西三个月后离职

卡帕西本人否认离职和这件事有关,但时间点本身就足以让人联想。

关于 Eureka Labs:

但真正让他这两年出圈的,其实不是这份履历,是两个词。

二、真正让他出圈的两件事

第一个词:vibe coding。

2025 年 2 月 2 号他发的一条推。意思是完全相信 AI 写的代码,人不再去看代码本身,只看效果对不对。

仅仅一年多,这个词彻底出圈了,已经变成一种工作形式的范式。

第二个:大模型 Wiki。

2026 年 4 月 4 号,他在 GitHub 上发布了一份公开笔记,名称就叫「大模型 Wiki」。

核心想法是这样的——

现在大家都在用 RAG,每次问完问题就去外部资料里捞一遍。卡帕西觉得这有点浪费。他的提案是建一个由 AI 持续维护的知识库,把笔记、文档、SOP 分成三个层级,让 Agent 帮你持续整理。知识越攒越多,不用每次从零开始。

延伸到现在,B 站和其他平台很多教 Obsidian 的视频,基本上都是从这一个笔记概念里延伸出来的。

可以看出门道——他这两年做的事情,全部都是在做「怎么让模型用得更好」。

而这恰好是 Anthropic 这一年在做的事情。

三、Anthropic 这一年在做什么

先看一组数据(来自 Ramp 企业 AI 采纳指数,覆盖 5 万多家美国企业的真实消费):

先说清楚一个点:这个数据不代表全美企业的全样本,OpenAI 还有不少大客户合同和消费端盘子。但作为市场信号,它很难被忽视。

第二件事:2026 年 5 月 4 号,Anthropic 宣布联合黑石、Friedman、高盛几家投资机构,一起创办了一家新的 AI 企业服务公司。目标客户是中型企业,Anthropic 派工程师驻场,把 Claude 落到这些企业最关键的业务流程里。

也就是说,Anthropic 在出一套「怎么用模型的方法」,然后工程师服务层、合作网络,全部跟着这一套方法去走。

这就是卡帕西和 Anthropic 在同一个理念上撞到一起的地方。他们在「怎么让人们更好地使用 AI」这件事上,已经平行走了一年了。

这个理念有个名字——Wrapper(套壳)

四、Wrapper 才是产品

2023 年的时候,「套壳」还是个贬义词。你做了个 AI 应用,背后接了大模型,别人会觉得你不就是套了一个壳,没什么技术含量,谁都能做。

到 2025 年风向完全变了。Cursor、Perplexity、Claude Code,这些套壳产品反而真正赚到了钱。从 Wrapper 被骂,到 Wrapper 才是产品

到现在,大多数人谈 AI 还是从模型出发——GPT、Claude、Gemini,讨论谁的跑分更高。模型当然重要。但当你真的深度使用过这些工具一段时间,你会发现:

同一个模型,不同人用、在不同客户端用,效果天差地别。

差距在哪里?就在 Wrapper 上面。

什么叫套壳?把模型放在中心——Claude、GPT、Gemini、DeepSeek,中心是一个模型,往外一层一层套:

  • 第一层:命令行工具,比如 Claude Code
  • 第二层:Skills(技能)、子智能体、Agent Teams——功能扩展
  • 第三层:Hooks、MCP——事件和协议
  • 最外层:记忆 + CLAUDE.md 文件——给模型的上下文环境,让它知道你是谁、你在做什么、你要什么样的结果

这是一颗洋葱。从里到外整体才会构成你真正在用的产品。

我自己使用 Claude Code 这几个月最深的体感是——每一次模型升级,感觉其实强的并不多,只能说从 100 分提到 105 分。但把 CLAUDE.md 写好、把 Skills 配对,同一个项目跑出来效果完全不一样。

举个例子。我想让它给我写一段主持稿。

刚开始我得反复来回四五轮,才能得到我要的版本——因为它不知道我要什么腔调、不知道我哪些表达是不能动的。

后来我把 CLAUDE.md 写好,告诉它我是谁、我在做什么、我要什么样的语气。同一个模型,直接一轮就能产生我可以直接使用的稿子。

差距就在这个套壳上。你不需要等更好的模型,你只需要学怎么把这个模型更好地使用。

这也是为什么卡帕西加入 Anthropic 这件事值得认真去看,而不只是停留在「大牛跳槽」这一层。

五、卡帕西到 Anthropic 不是去训练新模型的

他这次加入 Anthropic,他不是来训练新模型的。

Anthropic 预训练团队负责人 Joseph 在 X 上的原话是:

卡帕西会带领一个新的团队,用 Claude 加速预训练研究本身。

绕了一个圈,意思是——用 Claude 去训练 Claude

听到这里你可能会觉得,他要做的是把 Agent 能力做进模型里,让模型不靠套壳也能多步推理、调用工具、自我修正。但这条路所有人都在走,不管是 GPT 还是 Claude 最新一代都在做。

如果是做类似的工作,Anthropic 不会专门为他建一个新团队。

卡帕西要做的方向是反过来的:

让 Agent 去训练模型。

具体来说,让 Claude 帮研究员提代码方案、写预训练代码、跑消融实验、生成训练数据,然后 Claude 自己评估、筛选这些数据。卡帕西当资深品味的把关人。

Agent 在下面干苦力做研究,做一个 Claude Code 级别的框架;卡帕西在上面把关。

把两个方向分清楚——

卡帕西这两年所有的实验——vibe coding 也好,大模型 Wiki 也好——本质都是在为方向二做准备。先想明白怎么用模型(人在上面把关,Agent 在下面干活),再把这套思维套进训练循环本身。

这是这一次跳槽最有重量的一件事。

六、一个被忽略的细节:Anthropic 的核心团队,本来就是 OpenAI 的人

这里有一个细节,很多人都没注意到。

Anthropic 不是一家普通的对手公司。它的核心团队,全部是 2020 到 2021 年从 OpenAI 集体离职出来创办 Anthropic 的:

  • CEO Dario Amodei
  • 总裁 Daniela Amodei
  • GPT-3 主要作者 Tom Brown
  • Scaling Laws 论文一作 Jared Kaplan

也就是说,卡帕西这次去 Anthropic,他去的根本不是陌生人那里。OpenAI 的另外半个核心团队,早就在那边等他了。

这才是「两条已经汇流的河」真正的意思——理念汇流是一层,更深的一层是人本来就应该聚到一起。

七、两条河汇流的三个匹配点

把卡帕西这两年做的事,和 Anthropic 近一年做的事并排去放,会发现他们走在同一个方向上:

第三点说一下。卡帕西在那条加入推文里专门写了一句话——「对教育依然保持热情,打算在合适的时机重启」。说明 Eureka 只是暂停了。

Anthropic 学院已经有 17 门课——Claude 101、Claude Code 101 这些,涵盖从非技术岗到技术岗全套。但说实话,没多少人真的去认真学过。

所以卡帕西的角色其实不在填补空缺——Anthropic 自己已经在做。他带来的是触达和风格。他一条油管视频几百万播放,一条推特带动整个 AI 圈风向。布道者那种意思。

总的来说,卡帕西这两年所有的实验和教学,都是在做一件事:让普通人能够驾驭模型。Anthropic 这一年所有的产品也在做这一件事。

他们的终点是殊途同归的,区别只是分开做还是一起做。

八、卡帕西加入之后,可能会发生什么(三个预测,纯主观)

预测一:上下文集市

我猜 Anthropic 可能会做一个「上下文集市」。

注意,不是那种写营销文案的提示模板、固定 Agent 的玩意——那种东西不值钱,GPTs、Gemini 早就在做。

更可能的形态是:Skill + 工作流 + 项目记忆 + 评测循环,打包成一个上下文包,放到市场里,让人按需接入。

举个例子。一个会计把他的月结流程、审计 SOP、常见错误、发票报销这些流程全部打包上架。另外一家小型公司的财务下载接入,Claude 就能根据这家厉害公司的流程去跑,不需要重新解释。

往这一个方向延伸是顺理成章的。而且这一块 Codex 已经走在前面了——为什么最近 Codex 大家觉得越来越好用?就是因为它加入了插件功能,把很多内容打包了。这是 Anthropic 不跟也得跟的,只不过可能会做得更好。

预测二:Goal 风格命令的深化

Claude Code 最近有了一个新命令叫 GOAL,给 Agent 一个目标,让它一直工作到你说停。

这个命令最初是 Codex 那边做的,不是 Anthropic 这边。但接口逻辑太对了,所有人都在跟。

我猜接下来会出现的是——在 GOAL 上一步延伸。

GPT 有 Pro 模型(官方名称叫「研究级智能体」),Claude 网页端也有「研究级探索」。它们的共性是让智能体自主收集资料、对比来源。

后面可能出现深度研究的命令,直接放在 GOAL 后面:让智能体自主收集资料、对比来源、出报告、debug、跑测试、找 bug、一直改到能上线。

本质变化是——从「做这一步」到「达成这一个状态」。你不需要再管它怎么做、用什么接口、什么风格、什么编程语言。你只需要等待结果。

预测三:非开发者的智能体打包工具

这是卡帕西加入之后我最想看到的一个猜测。

他在那条推文里专门写了「在合适的时机重启教育这件事」。说明心里还是带着挂念的。

Anthropic 现在有 Claude Cowork——给非开发者的桌面智能体。但用过的人都知道,它对很多事情特别鸡肋。或者说不能算鸡肋,是它还停留在「非开发者用 Claude 帮自己干活」这个层面。

我觉得下一步可能更激进——让非开发者把脑袋里的领域知识、经验打包成智能体,让别人也能用。

举几个例子。做自媒体,做得久的人特别厉害,他知道什么样的选题会爆、什么样的封面让人点击率更高。但这些东西在他脑子里,不在任何文档里。他不是开发者,让他去写规范文档、写 CLAUDE.md,强人所难——大部分判断他还是要靠脑子里的经验。

下一步可能会推出更简单的打包工具,让这些人更自然地描述流程、上传样本,教会智能体什么叫好。这个智能体还可以上架、共享、卖给同行、收费。插件市场就循环起来了。

我觉得这才是真正的「人人都能使用大模型」——不只是 Claude,各家公司应该都会这样做。

而卡帕西在 Anthropic 推进这件事的可能性,比谁都大。因为他真正是唯一一个长期把「让普通人能驾驭 AI」当作核心使命的人。

这一条我说实话没什么把握,纯猜。但也是我最想看到的。

九、结论:套壳才是产品

我的结论是——套壳才是产品

这个论断在今年越来越明显。

刚刚结束的谷歌开发者大会,他们之前的 Antigravity 是 IDE 形态的。这一次大会直接升级到 Antigravity 2.0,把 IDE 形态完全砍掉,更新成独立桌面 App,形态上更接近 Codex 这样的超级应用。

足以证明,不只是 Anthropic 在这个方向上走,Codex 也好、Antigravity 也好——下一步谁能把这个超级应用推出来,谁就掌握市场话语权。

从最近 Codex 的热度就可以看出来,它这一步走对了。

本文由 @陈与小金 原创发布于人人都是产品经理。未经作者许可,禁止转载

题图来自Claude官网截图

更多精彩内容,请关注人人都是产品经理微信公众号或下载App
评论
评论请登录
  1. 目前还没评论,等你发挥!