大厂留不住AI科学家:OKR如何吃掉创新?
科技巨头正面临AI人才的集体流失潮——谷歌27亿美元收购的天才科学家Noam Shazeer转投OpenAI,AlphaFold之父John Jumper出走Anthropic,阿里通义千问核心架构师周靖人频传离职。这场涉及谷歌、阿里等巨头的AI人才争夺战,暴露出大厂管理机制与AI创新需求的根本性冲突。

2026 年 6 月 18 日,Noam Shazeer 在社交媒体上发了一条简短的消息:他将离开谷歌,加入 OpenAI。
Shazeer 不是普通工程师。他是 Transformer 架构的核心作者之一,也是谷歌 Gemini 大模型的联合负责人。2024 年 9 月,谷歌花了 27 亿美元收购他创办的Character.AI,把他请回来主导 Gemini。不到两年,他走了,去了谷歌最直接的竞争对手。
消息发酵的第二天,6 月 19 日,John Jumper 也宣布离开 DeepMind。Jumper 是 2024 年诺贝尔化学奖得主,他领导的 AlphaFold 团队做出了蛋白质折叠预测,被 Demis Hassabis 称为“改变了世界”。他在 DeepMind 待了将近九年,博士毕业六个月就被破格委以重任。现在他去的是 Anthropic,另一家正在跟谷歌抢 AI 人才的创业公司。
三天,两位奠基级别的科学家,去了两家竞争对手。Alphabet 股价两天跌了将近 7%,创一年多来最大单日跌幅。
差不多同一时间,阿里巴巴也卷入了一场人事风波。
6 月 12 日晚,业内社群开始流传“阿里首席科学家周靖人已提交离职申请”的消息。周靖人是通义千问大模型从零到一的核心搭建者,2025 年 12 月刚刚入选阿里合伙人。
但 2026 年以来,他的岗位已经变了三次:4 月卸任阿里云 CTO 转任首席 AI 架构师,6 月 8 日通义事业部被划入新成立的 Token Foundry 由 CEO 吴泳铭直管,他本人被安排去牵头 AI 未来研究院。履新首席科学家刚满六天,离职传闻就炸了锅。
阿里巴巴在 6 月 14 日辟谣,称“周靖人辞职纯属谣言”。
但多位阿里内部人士表示,今年以来通义团队的调整频率和方式,让不少技术骨干感到不安。“不是钱的问题”,一位接近通义实验室的人士说,“是你不知道下个月你的老板是谁,你的团队归谁管,你做的方向明年还在不在。”
如果把时间线拉长一些,会发现这不是几起孤立的人事变动,而是一个正在加速的趋势。根据过去两年全球主要科技公司 AI 核心人才流动的公开数据,超过 60% 的流出人才去了创业公司,而不是另一家大厂。
一个问题浮现出来:在 AI 这个被公认为“烧钱游戏”的赛道里,坐拥最多资源的大公司,为什么反而成了人才输出方?
一、“20 项 OKR”:一个 AI 团队的日常
一份某互联网大厂 AI 部门 2025 年度的 OKR 清单显示,这份文档列出了超过 20 项核心目标:模型性能提升 10%、推理成本降低 15%、支持 5 个业务线接入、发表 10 篇顶会论文、开源 2 个项目、申请 30 项专利。每一项都被标记为“P0”:最高优先级。
该团队约有 200 人。
“当你有 20 个 P0 的时候,你其实一个 P0 都没有”,一位曾在该团队工作的工程师回忆道。他已在去年离职,加入了一家 AI 创业公司。“每件事你都要做,每件事你都做不深。一个研究员同时挂着三个业务线的交付任务,他哪还有时间做基础研究?”
这不是个例。多位来自不同大厂 AI 部门的人士描述了相似的工作状态:双月会、季度复盘、跨部门对齐、业务方需求评审,这些管理动作占据了团队负责人相当一部分精力。有同学提到,他所在团队的负责人每周参加的各种对齐会议超过 15 小时。
一位字节跳动 AI 实验室的前负责人曾在内部表达过类似的担忧。他在一次团队内部分享中说,大厂习惯的“赛马机制”、追求短期 KPI 的高频考核、“大中台”模式,在 AI 这种需要长期主义和敏捷响应的领域水土不服。
2025 年 8 月,字节豆包大模型视觉基础研究团队负责人冯佳时离职。同月,火山引擎 AI 应用产品线一号位骆怡航出走,加入 AI 创业公司生数科技出任 CEO。
清程极智联合创始人师天麾的选择更直接。他高中保送清华,博士毕业,大厂用高薪挖他,他拒绝了。“在大厂,你的研究方向和优先级是老板定的,”他在一次采访中说,“创业的话,方向是你自己定的。这不仅仅是自由的问题,当你自己定义问题的时候,你投入的程度是完全不一样的。”
二、谷歌的 27 亿美元,买回了一个“被管起来”的科学家
Noam Shazeer 离开谷歌的故事,值得仔细还原。
2024 年 9 月,谷歌以 27 亿美元收购了 Shazeer 创办的Character.AI。这笔交易的核心目的之一,是把 Shazeer 本人请回来,他被任命为 Gemini 模型的联合负责人,直接向 DeepMind CEO Demis Hassabis 汇报。
Shazeer 回归后,Gemini 经历了一段被内部称为“追赶期”的密集迭代。多位谷歌前员工说,Shazeer 在团队中以“极度专注、厌恶官僚流程”著称。他习惯小团队作战,对大型评审会和层层审批感到不耐烦。
一位与 Shazeer 有过工作交集的人士回忆了一个细节:在一次 Gemini 的产品方向讨论会上,Shazeer 提出跳过某个合规审批环节直接推进模型测试,被管理层以“需要法务团队评估风险”为由否决。Shazeer 在会后对身边的人说了一句:“我回谷歌是为了做模型,不是为了做法务尽调的。”
据了解,Shazeer 在谷歌的最后几个月里,与 DeepMind 管理层在多个议题上产生了分歧,包括 Gemini 的商业化节奏、模型安全审查流程的长度、以及资源在基础研究和产品开发之间的分配比例。
他的去向选择几乎是一种反向声明:OpenAI,此刻在模型竞赛中与谷歌正面交锋的公司。
“这就像是,你花 27 亿把人请回来,然后把人管跑了,再然后他去了你最不想让他去的地方,”一位硅谷 AI 投资人这样评价。
三、AlphaFold 之父的选择:为什么是 Anthropic?
John Jumper 的离开更值得玩味。
Jumper 在 DeepMind 获得了科学家能获得的几乎所有荣誉:诺奖、学界认可、公司内部的极高地位。Hassabis 在公开回应中写道:“我们在 AlphaFold 上取得的成就改变了世界。”两人的告别温文尔雅,没有公开的不快。
但多位接近 DeepMind 的人士透露,Jumper 的离开与 DeepMind 近年来的定位转变有关。
DeepMind 创立于 2010 年,初始使命是“solve intelligence”(解决智能问题)。2014 年被谷歌收购后,它长期保持着相对独立的运作方式。但 2023 年,谷歌将 DeepMind 与 Google Brain 合并,成立了新的 Google DeepMind。
“合并之后,DeepMind 的底色变了,”一位曾在 DeepMind 伦敦办公室工作的研究员回忆道。“以前我们开玩笑说 DeepMind 像个研究院,合并之后它越来越像一个产品部门。Gemini 成了所有事情的中心,基础研究的空间在收窄。”
Anthropic 在 2026 年上半年给了 Jumper 一个巨大的画布。这家估值已近万亿美元的公司,正大举进入 AI for Science:收购了计算生物学团队 Coefficient Bio,建立自有湿实验室,与霍华德·休斯医学研究所展开合作。Jumper 在 Anthropic 不是去做一个成熟系统里的齿轮,而是去搭一个全新的引擎。
一位接近 Anthropic 管理层的人士表示,Jumper 在 Anthropic 拥有“几乎不受限制的科研自主权”,这与他在 DeepMind 后期的处境形成了鲜明对比。
四、“明升暗降”的阿里剧本
国内的故事几乎在平行上演。
周靖人在阿里巴巴的完整履历如下:
2016 年加入阿里,任阿里云首席科学家
2022 年底,升任阿里云智能 CTO,兼任通义实验室负责人,全权带队通义千问研发
2025 年 12 月,入选阿里合伙人,进入最高决策层
2026 年 4 月,卸任阿里云 CTO,就任集团首席 AI 架构师
2026 年 6 月 8 日,通义事业部并入 Token Foundry,CEO 吴泳铭直管;周靖人转任首席科学家,牵头 AI 未来研究院
2026 年 6 月 12 日,离职传闻开始在业内社群疯传
周靖人一手搭建了阿里通义大模型体系。在他领导下,Qwen 系列在全球开源模型中的衍生模型数量一度突破 8 万个,超过 Meta 的 Llama 系列。他是少数以纯技术背景进入阿里合伙人序列的高管。
但 2026 年以来的三次岗位变动,每一次都在物理上把周靖人推得离业务决策更远。一位阿里云前中层分析道:“首席科学家在阿里是最高的学术头衔,但不管人、不管钱、不管产品路线图。通义事业部被划进 Token Foundry 以后,周博士手下的团队、预算、业务审批权都没了。外人看起来是‘荣升’,内部人都知道是怎么回事。”
这位人士表示,即便阿里辟谣了周靖人的离职传闻,“被架空”的感知已经在团队内部形成。他补充道:“AI 行业的人才是全球流动的,他们不只看头衔,看的是能不能真的做成事。”
五、“KPI 吃掉创新”的结构性困境
几起人事事件只是症状。病因出在更深处。
多位从业者的观察,指向了大厂在 AI 时代的同一个结构性困局:移动互联网时代建立起来的管理体系,正在系统性地抑制 AI 创新。
移动互联网的成功法则是什么?快速试错、数据驱动、赛马机制、规模化复制。这些打法之所以有效,是因为移动互联网产品有明确的指标:日活、留存、时长、转化率,每个环节都可以量化、可以优化、可以“卷”。
但 AI 大模型有本质不同。一位在国内某头部 AI 创业公司担任 COO 的创业者分析道:“做移动互联网产品,你可以用 AB 测试来决策。但做大模型,你不能 AB 测试,你今天训练一个模型,一个月后才看到结果,你不可能一个月后再来 AB 测试另一个方案。大模型的创新节奏,天然跟大厂的月度、双月考核周期打架。”
他补充了一个细节:他此前在某互联网大厂 AI 部门工作时,每一次季度复盘都要拿出“可见的产出”,要么是模型指标提升,要么是产品功能上线,要么是论文发表。“如果你一个季度没交出这三样东西里的一样,你就会被标记为“没有产出”。但做大模型研究,有时候一个季度就是在试一个方向,试出来是死路,这也是有价值的。但大厂的体系不认这种价值。”
开源运动的冲击进一步放大了这个矛盾。
阿里开源的 Qwen 和 DeepSeek 开源的 V4 系列,让最前沿的模型能力变成了某种意义上的“公共品”。多位开发者反映,目前国内大量 AI 应用的底层模型用的就是开源方案,而不是自研。当模型本身不再是壁垒,竞争的关键从“谁的模型更强”转向了“谁更懂场景、更快迭代产品”。
而后者恰恰更有利于小团队。“场景理解需要的是跟用户泡在一起,产品迭代需要的是快速决策,这些事情在 10 人团队里就是一句话的事,在大厂里要过好几层评审”,一位从字节离职创办 AI 应用公司的创始人说。“我们周一决定做一个功能,周三上线。我在字节的时候,同样的事最快两周,因为有评审、有排期、有资源协调。”
六、人才流向哪里?
根据公开统计数据,2024 年至 2026 年 6 月,全球 AI 核心人才流动中,在可确认去向的 78 位知名 AI 研究者里,49 位选择了创业或加入创业公司,占比超过六成。
他们去的地方,是 Anthropic、OpenAI、DeepSeek、月之暗面、智谱 AI 这些独立 AI 公司,而不是另一家大厂。
“大厂的 AI 人才去小厂,不是因为钱,”一位专注 AI 领域的猎头分析道。“大厂的薪酬 package 往往更高,尤其是股票部分。问题出在三个地方:第一,你能不能做你想做的方向;第二,你的决策链条有多长;第三,你做的东西能不能真正落地。大厂在前两点上普遍不如创业公司。”
这位猎头提供了两组具体对比:某头部大厂 AI 研究员想要启动一个新方向,从提方案到获得正式批准的平均周期是 4 到 6 周。而在大多数 AI 创业公司,这个过程不超过一周。在大厂,一位 AI 研究员大约 40% 的时间花在各种会议和流程上;在创业公司,这个比例通常低于 15%。
她还提到一个更具象的细节:“有的候选人跟我说,在大厂最累的不是写代码、跑实验,而是‘跟各部门对齐’。一个大模型团队,要跟云部门对齐、跟业务部门对齐、跟中台对齐、跟法务合规对齐。你但凡有一个部门不点头,实验就跑不了。”
七、谷歌的 AI 正在吃掉谷歌
大厂的另一层困境藏在商业模式里:AI 不是在帮大厂赚钱,而是在吃它的老本。
谷歌是最极端的例子。根据 SparkToro 和 Similarweb 2026 年 6 月的数据:谷歌搜索的“零点击率”:也就是用户搜完东西看到 AI 生成的答案摘要就离开、不点击任何链接的比例,已经达到 68%。AI Overview 中的广告比例从 2025 年 1 月的约 3% 上升到 2026 年 6 月的 25.5%,但广告 CPM 远不及传统搜索结果页。
换句话说,谷歌每提升一次 AI 搜索体验,就在自己的传统广告收入上咬一口。
Alphabet 在 2026 年 6 月宣布将通过股权融资筹集 800 亿美元,用于 AI 资本支出,全年 AI 总支出预计达到 1800 亿至 1900 亿美元。钱砸进去了,但回报路径并不清晰。
国内大厂同样面临类似的尴尬。字节跳动投入豆包,但豆包跟抖音的关系是什么?一位字节内部人士表示:“豆包如果做成了一个独立超级 App,它会不会分走抖音的流量?如果它始终依附在抖音生态里,它是不是就永远长不大?这个问题没人能回答,但每个人都在想。”
腾讯的元宝也一样。元宝接入 DeepSeek 之后数据涨得很快,但它怎么跟腾讯的核心业务,微信、游戏产生化学反应?“元宝在腾讯内部的定位一直在摇摆,有时候是独立产品,有时候是工具插件”,一位接近腾讯 AI 团队的同学透露。“定位不确定,团队的资源优先级就跟着不确定。”
八、竞争格局正在分化
数据显示,中国大模型赛道经历了剧烈的洗牌。2023 年的“百模大战”期间,国内大模型厂商超过 200 家。到 2026 年上半年,存活下来且仍具竞争力的已不足 10 家。
三家大厂,字节、阿里、腾讯占据了 AI 商业化市场约 85% 的份额,但这个份额主要来自它们将 AI 集成到现有的云服务和 SaaS 产品中,而非来自原生 AI 产品。真正的原生 AI 应用,如编程助手、AI 搜索、AI 视频生成的头部玩家恰恰是创业公司。
一位在科技行业跟踪了二十年竞争格局的分析师总结道:“移动互联网时代的逻辑是‘流量 + 资本 = 通吃’。AI 时代这个逻辑不一定成立了。第一,流量在 AI 产品的初期并没有那么大的杠杆作用,你不需要一亿用户来训练模型。第二,资本的优势正在被开源和降本增效的技术突破稀释,DeepSeek 花 600 万美元做的事,大厂花了几十亿。第三,AI 产品的核心竞争力是‘场景深度’,不是‘用户广度’,一个医疗 AI 助手的价值,取决于它有多懂医生的真实工作流,而不是它有多少月活。”
尾声:AI 时代的权力再分配
2026 年 6 月 23 日,也就是 Noam Shazeer 和 John Jumper 宣布离职的同一周,DeepMind CEO Demis Hassabis 的一位身边人转述了他近期在一次内部管理会上说过的话。
他说,DeepMind 依然是全球最好的 AI 研究机构之一,个别人员的离开不会动摇它的根基。“但我们应该认真地问自己一个问题:当一个科学家在这里觉得‘被管理’的感觉超过了‘被赋能’的感觉,他离离开就不远了。”
在杭州,DeepSeek 的办公室不到三百平米。梁文锋在这里带着一个不到 150 人的团队,做出了让谷歌、OpenAI 和整个硅谷侧目的模型。DeepSeek 没有双月会,不设 OKR,梁文锋本人直接参与技术讨论。一位 DeepSeek 的研究员描述了他的日常:“就是写代码、跑实验、看论文、跟同事讨论。没有别的。”
在 2026 年的 AI 行业,大公司仍然握有最多的钱、最强的算力和最大的用户基数。但人才、创意和突破性的技术成果,正在越来越多地从小公司里产出。
一位从谷歌跳槽到 Anthropic 的研究员,在被问到为什么离开时,回答了一句话。他说:“我在谷歌的工位越来越宽敞,我写的代码也越来越安全,但我能决定的事情越来越少。”
他没有再多解释。但这个故事,已经说完了。
本文由 @花爷本爷 原创发布于人人都是产品经理。未经作者许可,禁止转载
题图来自Unsplash,基于CC0协议

起点课堂会员权益





确实,AI研究的试错成本高,大厂的季度考核很难给空间。如果像DeepSeek那样不设OKR,研究员就能把精力全放在实验和讨论上,而不是对齐和汇报。