工程师开始做PM的活了，那PM在干嘛

搜索

APP

起点课堂会员权益

职业体系课特权

线下行业大会特权

个人IP打造特权

30+门专项技能课

1300+专题课程

12场职场软技能直播

12场求职辅导直播

12场专业技能直播

会员专属社群

荣耀标识

发布

工程师开始做PM的活了，那PM在干嘛

Ve观产品

2026-06-22

0 评论 239 浏览 1 收藏

12 分钟

Anthropic的工程师能在短短一周内完成从用户反馈到功能上线的全过程，甚至无需PM介入。这背后隐藏着怎样的产品逻辑？Claude Code的产品负责人Cat Wu揭示了他们的秘密：一张清晰的Agent产品演进地图。从单任务成功到大规模并发，每个决策都能在这张地图上找到坐标。

你上次从用户反馈到功能上线，用了多久？

Anthropic的工程师，用一周。期间没有找PM对齐，没有排期会议，没有需求文档。

这不是特例。Cat Wu是Claude Code的产品负责人，她在接受Lenny Rachitsky采访时说：她团队里有工程师，能从Twitter上看到一条用户反馈，到产品从设计到上线，全链路独立完成，几乎不需要PM介入。

那PM在干嘛？

Cat Wu的答案，和你预想的大概不一样。

先说为什么PRD不管用了

传统产品流程有个前提：你调研完、写完PRD、对齐完所有人，6个月后交付的时候，技术边界跟你最初设计时差不多。这个前提在大多数产品里是对的。

在Anthropic不是。

Cat Wu做了一件很具体的事来说明这件事。从2024年10月开始，每次有新模型发布，她就让Claude Code给Excalidraw加一个表格功能，然后看它能走多远。

Sonnet 3.5 new：失败。后面几个版本：还是失败。2025年6月Opus 4：开始偶尔能成，成功率够稳定，Anthropic拿它做了Claude 4发布会的预录演示。2026年，Opus 4.6：可以在几千名开发者面前直播，不需要预录，不担心翻车。

同一个prompt，两年，从必然失败到可以直播。

METR测量的Agent任务时间上限，同期从21分钟跳到了将近12小时。16个月，41倍。

在这个速度下，6个月路线图意味着什么？你PRD写完的那一刻，所有建立在当前技术边界上的假设，可能已经不成立了。

所以Anthropic不是不规划，是规划的单位缩了。他们把短期探索叫”side quest”——在正式路线图之外，工程师下午自己跑一个假设，PM用Claude Code三小时做出原型直接测。Claude Code桌面版、待办事项功能、AskUserQuestion工具，这几个功能都是side quest跑出来的，没有一个是季度规划会上提出来的。

为什么能这么快——有一张地图

不只是因为没有PRD。背后是Anthropic对Agent产品有一张演进地图，每次产品决策都能在上面找到位置，不用从头对齐。

地图分三个阶段。

第一阶段：单任务成功

Agent能不能从一个清晰的指令出发，稳定完成一件事？

2024年末Claude Code刚出来时，产品逻辑是线性的：你给指令，Agent做，你检查，没问题继续。人一直在旁边盯着。这个阶段产品要解决的问题只有一个：出错了你能快速知道、快速接管。

Bilt是一个典型的第一阶段入场方式。2025年2月他们开始用Devin，起点很克制：只把有明确范围、步骤清晰的简单任务交给Agent，人工全程审核结果。不是因为保守，是因为这是正确的起点——先搞清楚Agent在哪些事情上是可靠的，再往下走。

第二阶段：多任务并发

到2025年底，标准场景变成了同时跑6个任务。

6个任务在跑，你没法全盯着。你能做的是等它们跑完，然后一件件确认：这个对，这个不对，这个重做。你的角色变了——不是监工了，是审核人。

产品要解决的问题也变了：不是怎么让Agent操作更顺，是怎么让你知道什么时候该去看一眼。

Nubank的案例把这个阶段说得最清楚。他们要迁移一个累积了8年、600万行代码的遗留ETL系统，原计划是1000名工程师花18个月。引入Devin之后，一个工程师可以同时监管多个Devin，每个Devin负责一批迁移任务。工程师的工作从写代码变成了验收结果——哪些迁移对了，哪些有问题，哪些要重来。原来估算18个月的工程，几周之内完成了，效率提升12倍。这就是第二阶段的产品逻辑：人不在过程里，人在结果里。

第三阶段：大规模并发

下一步是同时跑50个、乃至几百个Agent。

本地机器内存撑不住，得远端跑。界面不能再是任务列表，你没精力逐条看几百条更新。这个阶段，Agent得能自己验证自己的工作，识别哪些地方需要你介入，把反复犯的错记住不再重犯。

你和Agent的关系，不是用工具了，是管团队。

Cursor在2026年1月做了一个激进的实验：让Agent在一周内从零搭出一个完整的浏览器引擎，项目代码超过100万行。他们尝试了几种多Agent协作架构，最后跑通的是三层分工：Planner持续探索代码库、分解任务，Worker独立执行各自的任务，Judge在每个周期末判断继续还是回退。

他们也踩到了第三阶段最典型的坑：20个平级Agent抢资源会互相卡死；Agent之间没有明确分工就会变保守，主动回避难题。这些不是技术bug，是产品设计问题——Agent团队需要的是组织架构，不只是更多算力。

有了这张地图，每个功能决策都能找到位置。这是帮用户从第一阶段走到第二阶段，还是在解决第二阶段的信息过载，还是在给第三阶段铺路——想清楚这个，决策成本大幅下降。

工程师能独立上线功能，不是绕开了产品判断，是产品判断已经内化在这张地图里了。