八倍产出之后，Anthropic 工程团队发现了一个没人能解决的新问题

搜索

APP

起点课堂会员权益

职业体系课特权

线下行业大会特权

个人IP打造特权

30+门专项技能课

1300+专题课程

12场职场软技能直播

12场求职辅导直播

12场专业技能直播

会员专属社群

荣耀标识

发布

八倍产出之后，Anthropic 工程团队发现了一个没人能解决的新问题

深思圈

2026-06-24

0 评论 108 浏览 0 收藏

18 分钟

AI 正在彻底改写技术行业的工作范式。AI 大幅提升效率的同时，也带来协作疏离、质量把控难等全新问题。本文结合一线高管经验，解读 AI 时代工程师与管理者的能力转型趋势。

如果有一天，工程师写代码的时间只占工作的一小部分，那工程师还算不算工程师？这听起来像是个遥远的假设，但在Anthropic的Claude Code和Cowork团队里，这已经是正在发生的现实。Fiona Fung是这两个团队的负责人，她最近在Lenny’s Podcast上分享了一组数据，Anthropic的工程师平均每个季度交付的代码量，是几年前的八倍。不是缓慢爬升的曲线，是一条一直很平的线突然冲上了天。

听完这期播客，我脑子里冒出来的第一个念头是，编程这件事可能真的变了，而且变得比我们大多数人意识到的还要彻底。Fiona的经历很有说服力，她当工程师超过25年，从IBM写底层操作系统服务起步，到微软做Visual Studio和TypeScript整整11年，再到Meta从零搭建Facebook Marketplace，现在这个产品每年的GMV超过1000亿美元。她还参与过Meta第一代智能眼镜和AR眼镜项目，在Instagram带过500人的团队。这样一个人来谈AI怎么改变工程师的工作方式，分量是不一样的。

写代码不再是稀缺资源

Fiona讲了一个让我印象很深的对比。她说自己当年在微软做Visual Studio的时候，软件是刻在CD上发行的，每一次发布都有硬性截止日期，工程师的时间被当成最稀缺的资源，团队会花大量精力做计划，确保在有限的时间窗口里把事情做对。但现在情况完全反过来了，coding不再是瓶颈，反而把每个人能做的事情的天花板都给掀开了。

这句话我反复琢磨了好几遍。以前的限制是人手不够、时间不够，所以一个想法好不好，往往要先问值不值得投入工程资源去做。现在限制变了，理论上什么都能做，问题变成了你敢不敢想得更大。Fiona提到团队里一个工程师的真实经历，他本来不是做移动端的，但当产品需要补上移动端功能时，他直接说没关系，现在有Claude帮我一起做这件事。这种心态的转变，比八倍的代码产出数字本身更值得注意。产出是结果，敢于伸手去做以前觉得超出能力范围的事情，才是原因。

我自己在做内容创作和产品的过程中，也越来越能体会到这种感觉。以前觉得某个想法太复杂，需要专门去学一项新技能才能落地，常常因此放弃。现在反而会先问一句，这件事真的需要我亲自掌握所有细节吗，还是说我可以借助工具，把精力放在判断方向对不对上。这其实是把人的角色从执行者往前推到了决策者的位置，这个转变对很多人来说是机会，但对还停留在旧思维里的人来说，可能就是一种被甩在后面的焦虑。

Agency和accountability要绑在一起

Fiona提到一个词，agency，中文大概可以理解为主动性，或者说自主决策的能力。她说在Claude Code团队里，遇到一个问题，不是等着被分配任务，而是每个人都会主动想办法去解决，这是团队最看重的特质之一。但她马上补了一句，高agency必须配上高accountability，也就是高问责。给你足够的自由去发挥，但你也要清楚地说明你想解决的问题是什么，你的假设是什么。

我觉得这句话点出了一个很容易被忽略的陷阱。很多人理解AI agent带来的变化，只看到了自由度变大这一面，觉得反正有工具兜底，做错了重新生成就好，胆子可以放得更大。但Fiona强调的是，自由和责任是一体两面的，agency越高，越要能讲清楚自己在为什么目标负责，而不是把责任都甩给工具。这其实跟以前管理团队的逻辑没有变，变的只是行动的速度和门槛。门槛降低了，反而对判断力和说清楚动机的能力要求更高了。

这一点对我自己的工作方式也有启发。以前做一件事，流程本身会过滤掉很多不靠谱的想法，因为光是执行成本就足够让人三思。现在执行成本几乎消失了，真正能区分一个人做得好不好的，变成了他有没有能力提前想清楚要解决的问题是什么，做完之后能不能讲明白这个结果到底解决了什么。换句话说，思考的权重在上升，执行的权重在下降。

异步和routines改变了管理者的一天

Fiona分享了她自己工作方式的变化，这部分我觉得特别真实。以前她每天早上喝咖啡的时候，会去看团队的反馈渠道，自己判断哪些问题值得花时间处理。现在她设置了routines，可以理解成自动化的工作流程，每天早上自动扫描所有反馈渠道，总结出主题，甚至直接生成可以审查的PR。她说这就像是从自己生成prompt，变成了有一个agent帮她生成prompt和PR，抽象的层级又往上提了一层。

她还提到自己保留了一个Claude Code的远程会话，接入公司所有的代码仓库，也接入所有的Slack频道，这样她对团队在做什么有完整的可见度。每个月她会和团队一起回顾，过去这段时间聚焦在哪些方向，产品上线后效果怎么样，反馈渠道里都说了什么。她说以前这些会议大部分时间用来生成PR和修bug，现在这些会议变成了真正意义上跟人对话的时间，聊的是影响力，而不只是产出了多少。

这一段让我重新理解了管理者这个角色在AI时代应该往哪个方向走。管理的核心从来不是盯着任务清单，而是帮团队判断方向对不对、资源该往哪里投。以前因为信息获取成本高，管理者不得不花大量时间做信息整理这种体力活，真正花在判断和对话上的时间反而被挤占了。现在工具把信息整理这一层接管过去了，管理者被还原成了它本来该有的样子，一个负责判断和沟通的人，而不是一个信息搬运工。我觉得这才是Cowork这类工具真正厉害的地方，它解放出来的不是工作量，而是注意力。

Trust but verify，验证比写代码更难

产出涨了八倍，质量怎么保证，这是我听这期播客时最关心的问题。Fiona给出的答案是trust but verify，也就是信任但要验证。她说Claude在有明确框架可以对照验证的时候表现非常好，所以她们的做法是把什么叫好的标准写成spec，放进代码仓库里，跟随代码一起更新，这样Claude做代码审查的时候，就有一个清晰的标尺可以对照。

她还分享了一个很形象的框架，叫bad和sad。bad是指那种不可恢复的严重错误，比如程序崩溃导致工作丢失。sad是那种可以恢复、但体验不好的小问题，比如界面闪烁了一下。她说sad堆得多了，也会慢慢演变成bad，所以团队会主动盯着sad的数量，而不是等它恶化成真正的事故才处理。这种分级方式比单纯看一堆性能指标仪表盘有用得多，因为指标太多太碎的时候，人反而很难判断一个数字到底好不好。

我觉得这套思路的价值，远远超出了软件工程的范畴。任何依赖AI agent去批量产出内容或者执行任务的场景，都会遇到同样的问题，产出快了，谁来把关质量。Fiona给出的解法本质上是把人的精力从逐条检查，转移到了设计验证标准和监控体系上。人不再是质检流水线上的一环，而是定义什么叫合格的那个人。这个角色转变，我觉得比单纯讨论AI agent能不能写好代码，更值得每个用AI做内容或者做产品的人认真想一想。

一个人对着agent干活，会孤独

这一点是我完全没想到、但听完觉得特别真实的细节。Fiona说团队最近发现，大家因为太频繁地各自跟自己的agent协作，工作开始变得孤独。以前团队协作是真正意义上的协作，有人写后端，有人写前端，大家互相依赖、互相讨论。现在每个人都可以独立完成一整条任务链，人和人之间的交集反而变少了。

团队的应对方式是搞了一个pair-wise programming lunch，也就是结对编程午餐，大家一起观察彼此是怎么用Claude Code和Cowork的，互相学习不同的使用方式。Fiona说每个人用这些工具的方式都很不一样，光是看别人怎么操作，自己就能学到东西。她们还会专门安排hackathon，确保团队还有一起做事的时间。

这让我意识到，效率的提升和人的连接感，有时候是两件需要分别花心思维护的事情，不会自动同步发生。工具让单个人的能力边界扩大了，但团队作为一个整体的粘性，不会因为每个人都变强而自动变强，反而可能因为大家各自为战而被稀释。我觉得这对任何团队都是一个提醒，效率工具带来的孤独感是真实存在的副作用，需要主动设计一些机制去对冲，而不是假设它会自己消失。

管理者也要先做执行者，也要持续用自己的产品

Fiona提到她们招管理者有一个原则，新管理者入职之后，会先有一段时间纯粹做IC，也就是个人贡献者，先深入代码和产品本身，再去承担带人的责任。她说如果一上来就急着扮演管理者的角色，反而很难真正跟团队建立信任。先花时间理解产品和代码，再去支持别人，这个顺序很重要。

她自己也是这么做的，即便带着几百人规模的团队，她仍然会自己写一点代码，自己用团队做出来的产品处理日常工作，比如报销出差费用。她说这不是为了证明自己还能写代码，而是为了保持对产品的真实体感，不让自己变成只看仪表盘和PPT的管理者。她提到一个细节，卖二手MacBook的时候在Facebook Marketplace上差点被骗，这种第一手的踩坑经历，比任何数据报表都更能告诉你产品哪里出了问题。

我觉得这是一种很朴素、但极容易被忽略的纪律。职位越高，离产品的真实使用场景往往越远，听到的反馈也越容易被层层过滤和包装。Fiona讲的这个习惯，本质上是逼着自己始终站在用户的真实体验里，而不是活在汇报材料构建出来的那个版本的现实里。这一点不管是不是在做软件，放到任何管理岗位上都成立。

留意latent demand，别人用产品的方式，常常超出你的设计

Fiona讲了一个我特别喜欢的例子。她身边有朋友开餐厅，生活很辛苦，经常坐在吧台前一堆账单算到很晚。她自己用Cowork处理出差报销的时候，发现这个工具对处理票据和表格特别擅长，于是想，如果这对我这么有用，对这些小生意主肯定也很有用。她帮朋友们上手之后，发现大家用的方式完全超出她的预期，有个开餐厅的朋友直接让Claude去比较同地区同类菜系的定价水平，得到的结果像一份市场分析报告。

这就是latent demand，也就是潜在需求，指的是用户已经在用某个产品做一些你没设计过、但其实很有价值的事情，只是你没注意到。Fiona说团队一直会留意这种信号，Cowork后来专门为小企业做了一个功能打包，就是从这些观察里长出来的。她总结的方法论是，当你看到有人为了让某个东西work而拼命想办法绕弯路，这时候就值得问一句，能不能把这条弯路直接铺成一条直路。

这个观察方式我觉得特别值得借鉴。很多产品决策依赖的是用户调研和需求文档，但真正有价值的信号，往往藏在用户自己都没意识到要主动反馈的那些边缘行为里。要捕捉到这些信号，前提是你自己也在真实地使用产品，或者真的花时间去看身边的人怎么用，而不是坐在办公室里猜。

Context switching，一个还没人解决的新问题

播客接近结尾的时候，Fiona被问到现在还有哪些问题是团队没想明白的。她提到一个我觉得特别值得展开聊的点，因为routines和异步工作变得普遍，大家同时盯着的事情变多了，context switching，也就是注意力在不同任务之间切换的负担，正在变得越来越重。她说自己也会同时启动好几个agent去处理不同任务，结果发现自己反而需要专门留出一段时间，去消化所有这些异步任务跑出来的结果。

她坦白说这个问题自己也还没想清楚怎么解决。听到这里我反而松了一口气，因为这说明AI带来的不全是单方面的解放，它解决了一类问题，同时制造了一类新问题。以前的瓶颈是产出速度，现在产出速度不再是瓶颈了，瓶颈变成了人的注意力带宽够不够撑得起这么多并行的进展。

我自己最近写东西、做内容的过程中也有类似的感受。借助工具之后，可以同时推进的事情变多了，但脑子里要同时装着的线头也变多了。这让我觉得，接下来真正值钱的能力，可能不是怎么用好某个具体工具，而是怎么设计自己的工作节奏，让自己不被这么多并行的进展压垮。这是一个新问题，Fiona没有答案，我自己也没有，但至少现在知道这是一个值得认真对待的问题，而不是简单归结为不够自律或者工具用得不够熟练。

本文由人人都是产品经理作者【深思圈】，微信公众号：【深思圈】，原创/授权发布于人人都是产品经理，未经许可，禁止转载。

题图来自Unsplash，基于 CC0 协议。

更多精彩内容，请关注人人都是产品经理微信公众号或下载App