Prompt 已死、Loop 当立?这套新范式,PM 已经跑了十年
Loop Engineering 的崛起正在重新定义产品经理的价值。当工程师们用四次范式跃迁才走到PM的起点时,我们突然发现:把模糊目标拆解为可验收标准的能力,正成为AI时代最稀缺的硬技能。本文将从PDCA循环到敏捷看板,深度剖析loop engineering如何将PM的工作流代码化,并带来前所未有的权责挑战。

这两周,科技圈又发现了一块新大陆。
6月7日,一个叫Peter Steinberger的人在X上发了一句话:别再给编程Agent写提示词了,去设计那个提示它们的循环。这条推文几天就冲到五百万浏览。第二天,Google的Addy Osmani发了篇长文,给这件事正式命了名“Loop Engineering(循环工程)。”然后,一句被安在黄仁勋头上的话开始满天飞“现在没人写Prompt了,新时代的工作是编写和管理loop。”
于是这套叙事就成型了,《Prompt已死,Loop当立》。提示词工程师的尸骨未寒,循环工程师的招聘启事已经贴出来了。X上一堆账号开始疯转,配文清一色是看完这个视频、再看下面这份完整指南,点进去多半是卖你一套Notion模板。
看了几天热闹,我心里冒出来的不是激动,是一种很奇怪的熟悉感。
你看loop的标准长相,定一个目标,让系统自己去找活、自己干、干完自己验收、不合格带着报错再来一轮,搞不定的才升给人。科技圈管这叫范式革命。可这套东西,换个房间、换身衣服,我们每天都在跑,它叫一个sprint,叫一轮PDCA,叫一块看板从左滑到右。定义目标、拆任务、盯执行、验收、回炉、升级,这不就是传统产品经理这个岗位本身吗?
但当所有人都仰着头看工程师又造了什么新词的时候,低头看看自己手里那摊活,你可能会发现一件更有意思的事。
这波热点真正改变的岗位,根本不是提示词工程师,是PM。所谓loop engineering,本质上是头一回,把产品经理这份工作,抽象成了一段能自己运行的代码。
而且耐人寻味的是,全网都在喊PM快去学工程师的新本事,但我想说的是工程师,终于追上了PM一直在做的那件事。
你们叫它范式革命,我管它叫上周二
先把 loop 这个词扒到底,去掉那层科技滤镜。
它的核心机制只有一句话:你不再亲手给 AI 下每一条指令,而是设计一个系统,让这个系统替你下指令、替你验收、不合格自己重来,直到把活干完,或者撞上你设的预算上限。人的角色,从那个一句一句敲指令的传话人,变成了一个定规则、设边界的设计者。
把这段描述里的AI这个词遮住,你品,你细品,这像不像在描述一个还不错的项目经理带团队?目标给清楚,标准定明白,过程不用我盯,你们自己跑,跑到符合验收为止,卡住了再来找我。
这正是那股熟悉感的来源。PDCA 循环——计划、执行、检查、处理,戴明老爷子讲了几十年。敏捷里的一个 sprint,规划会定目标,每日站会同步进度,评审会验收,回顾会改进,两周一轮。看板上的 WIP 限制,是在控制同时在跑的任务数量,免得失控。这些东西,逐个都能在 loop 的零件里找到对应。
工程师们这两年先是发现了 prompt(怎么把话说清楚 AI 才好好干);又发现了 context(光说清楚不够,还得把背景信息喂到位);再发现了 harness(给 AI 搭一个能调工具、能跑代码、能走权限的工作环境);现在终于发现了 loop(让这套东西能自己转起来、不用人一步步盯)。
这条演化路径,每一步都对应着人被往后挪一格。Prompt 那两年,你得盯着每一句话,AI 答一句你改一句,人就是瓶颈本人。到了 Context,你不再纠结一句话怎么写,而是操心该把哪些资料、哪段历史喂给它看,控制的颗粒从一句话变成了一堆信息。再到 Harness,你开始给它配工具、配权限、配一个能干活的环境,活像给新人开账号、配电脑、拉进项目群。每往前一步,你手上那根操纵杆,就离具体执行远一点,离规则设计近一点。
Prompt、Context、Harness、Loop,四个词,听着像四次革命,本质上是同一件事在反复发生,人对 AI 的控制粒度,一格一格地往上抬。从盯着写一句话,到提供一整套信息,到搭一个运行环境,到设计一整个循环。每一层都把人往后推了一步,推到离具体执行更远、离规则设计更近的地方。
而这条往后退的路,终点站站着的那个角色,不写代码、不碰执行、只定义目标和验收、为最终结果负责,它早就有名字了,就叫产品经理。
工程师花了四次范式跃迁,才退到 PM 一开始就站着的那个位置。
更何况,这套循环连在 AI 圈里都算不上新。早在 2022 年,姚顺雨在普林斯顿大学读博的时候就提出过 ReAct,让模型先想一步、再做一步、看一眼结果、再接着想,思考、行动、观察、再思考,这就是今天 loop 最早的雏形,那篇论文如今被引上万次。往学术里看是 ReAct,往管理里看是 PDCA,loop 这个东西,是被两个方向同时验证过的老配方,只是这次终于在工程上落了地。
就在大佬们前脚喊着 prompt 已死、loop 当立的同一周,已经有人在后脚宣布 loop 也死了。AI 热词不光死得快,还爱诈尸——前脚刚宣布 loop 已死,后脚它就从棺材里坐起来,问你课买了没。所以你大可不必慌着改简历,重要的从来不是这个循环这周叫什么,而是循环里那件没变的事,到底归谁管。

loop 的五个零件,就是你工作流里的五个环节
一个能真正跑起来的 loop,业内拆出来大概是五个零件。我们一个一个,跟 PM 每天在用的东西对一遍。
第一个零件,验收门禁,也叫停止条件。loop 得知道什么叫干完了,否则它要么停不下来烧钱,要么随便糊弄一下就交差。这个东西,PM 太熟了,它就是 Definition of Done,完成的定义。一个写得好的 loop 和一个写得好的需求,命门是同一个,你能不能把干完了这三个字,翻译成一条机器能判定真假的标准。所谓的 /goal,落到实处就是给它一句像所有 auth 目录下的测试通过、且 lint 干净这样的话,然后你就能走开了。这跟你给研发提需求时附上一条可量化的验收标准,是同一个动作。
第二个零件,独立验证器。这是 loop 设计里最精妙、也最反直觉的一条原则:写代码的和验代码的,必须是两个人。Claude Code 直接把这条写进了产品架构——大模型负责写,另一个独立的小模型负责验收,而且验收那个,看不到写代码那个的思考过程。为什么?因为模型给自己写的东西打分,手太松了,跟人一样。这套东西换成 PM 的语言,叫同行评审,叫 code review,叫 QA 和开发分家。自己不能判自己的卷子,这条规矩,产品和研发流程里立了多少年了。
第三个零件,状态文件。Agent 有个致命短板:它的记忆是一次性的,这一轮学到的东西,下一轮就忘得干干净净。所以得有个地方,把做到哪了、什么成了、什么挂了写下来,下次接着读。说白了,这就是需求文档,就是会议纪要,就是那块记录着每个任务卡在哪一栏的看板。Agent 会忘,但文档不会——这话听着是不是特别像你天天跟团队强调的,重要的事写进文档、别只在群里说一句。
第四个零件,止损上限。loop 跑起来不设刹车,你会跑到收到账单或者被限流才发现失控。所以要设 token 上限、迭代次数上限、时间上限。这对应的,是 PM 手里那些最朴素的管理工具:WIP 限制,控制同时在跑的活有多少;排期和预算,圈死一件事最多能花多少时间和资源。一个团队同时开二十个任务必然炸,一个 loop 不设上限地自己跑下去,是一模一样的炸法。
第五个零件,升级机制。loop 干得了的活自己干,干不了、或者碰到需要拍板的,才升级到人这里来等判断。这不就是向上汇报、不就是升级路径吗?一个健康的团队,不是什么都来问你,也不是什么都自己扛着捅出篓子,而是清清楚楚地知道,哪条线以下自己定,哪条线以上必须找你。
举个 PM 自己就能跑的例子。假设你建一个竞品监控的 loop:触发器,设成每天早上九点自动跑一次;技能是一段写好的指令,去抓这几家竞品的更新日志和应用商店评论,按你关心的维度归类;状态文件,记着昨天抓到哪、哪些已经汇报过、别重复打扰你;门禁是一条验收线,只有同时满足有信源、能去重、按维度归好类,才算合格,否则打回重抓;升级是当它发现某条重大改版、或者拿不准算不算重要时,单独标红推给你拍板。你看这套东西你压根不用懂什么循环工程,因为你设计它的每一步,调用的全是带团队的本能。
五个零件对完,结论其实已经摆在那了。
loop 根本不是什么新物种。它是把一个 PM 团队的运作机制,定义完成、交叉验收、信息留存、资源管控、分级上报——从人身上扒下来,原样翻译成了代码。你之所以看着 loop 觉得新鲜,可能只是因为,从来没人把你每天干的这摊事,画成过这么一张工整的架构图。
这张架构图带来的,不该是被冒犯,而该是一种迟来的确认:你这些年练的,根本不是什么虚的软技能。把目标拆清楚、给验收定标准、让信息不丢、把资源管住、让该上报的上报——这些被无数人当成会议室废话的东西,恰恰是一个自动系统能不能稳稳运转的硬约束。工程师们费了好大劲,才把它们一条一条,重新发明了一遍。

这波浪潮改变的是谁?
承认 loop 是 PM 工作流的代码化,会引出一个更有意思的推论,这波 AI 浪潮,真正被它重新定价的岗位,是产品经理,而且是利好。
回想一下提示词时代是怎么运转的。那会儿,会不会写 prompt 几乎等于会不会用 AI。可你仔细看那个过程,一个工程师对着对话框,反复试探怎么把需求说清楚,他其实在悄悄干一件本该是产品的活,把一个模糊的想法,逼成一个具体、可执行的指令。控制权,在不知不觉中,从产品那头滑到了离模型最近的工程师手里。
到了 loop 时代,这件事被掉了个头。
因为 loop 能不能跑起来,根本不取决于某一句提示词写得多漂亮,而取决于一个最上游的问题,你能不能给出一个机器可以验收的完成标准。这个标准定不出来,再聪明的循环也只会原地空转,要么停不下来,要么交一堆你根本不想要的东西。而把模糊的目标拆成清晰的、可验收的标准,这件事是谁的本职?是 PM 的。
于是你最被低估的那项手艺,定义清楚到底要什么、怎么算做到了,一夜之间,从一个可有可无的软技能,变成了整个系统能不能跑起来的承重墙。
正因为承重墙压在了这项技能上,loop 的炒作才注定要打折扣。真相是,大多数团队根本给不出一个干净的、机器可验收的 done,需求本来就是含糊的,目标本来就是在过程里才慢慢清晰的。所以你会看到大量 loop 在生产环境里翻车,原因往往不在模型笨,而在没人能把要什么这件事说清楚。换句话说,这波浪潮把瓶颈,从一个工程问题(模型够不够强),搬到了一个产品问题(你能不能定义清楚成功长什么样)。而后者,恰恰是稀缺的。
这事你只要提过需求就深有体会。你写一句优化一下搜索体验,研发问你怎么算优化好了,你卡住了,是首屏快 200 毫秒,还是点击率涨三个点,还是相关投诉少一半?这个卡住的瞬间,过去顶多让一次需求评审多开半小时;可在 loop 里,它是致命的,因为机器没法对着一个含糊的好字去跑、去验收。能把好翻译成一条可判定真假的标准,听上去基础,真做起来,是这个行业里最稀缺的能力之一。
这也顺带解释了,为什么那些把 loop 吹成一键解放双手的叙事,大概率会让第一批跟风的团队踩坑。他们以为买的是一个能自动干活的系统,其实买的是一面镜子,照出自己根本没把目标想清楚。系统越自动,这面镜子照得越狠。
这对 PM 意味着什么,应该不用我多说了。过去十年,这个岗位一直活在一种身份焦虑里,上不如老板有决策权,下不如工程师有硬技能,中间夹着,靠一张嘴和一个表格推着事情走,时不时还要被灵魂一问,你到底创造了什么价值。现在,AI 把那个你以为最不值钱的环节,顶成了最值钱的环节。
一群会装懂的直接下属
产品经理这个岗位,有个流传很广的自嘲,责任无限大,权力无限小。你要为一个产品的成败负责,手底下却一个能直接指挥的人都没有,全靠所谓的影响力,说服、对齐、刷脸、请客吃饭,推着一群不归你管的人,去做你觉得该做的事。
loop,第一次把这件事改了。
当你设计一个循环,派一群 Agent 去并行干活,每个在自己隔离的分支里跑,一个写一个验,搞不定的才进你的收件箱,你忽然就有了一支真正归你直接指挥、且产出由你负责的团队。Claude Code 那位负责人 Boris Cherny 自述,他手下几百个小 Agent 同时在跑,有的扫代码仓库的待办,有的读用户反馈,有的盯持续集成的失败,他本人去年十一月就把 IDE 卸载删了,大部分代码现在直接在手机上完成。
这是 PM 做梦都想要的:一支不会顶嘴、不会请假、不会在你背后甩锅、二十四小时连轴转的团队。
但先别急着乐。因为团队一旦到手,那套你从来没真正逃开过的管理难题,会原封不动地搬过来,一个都不少。
要不要授权,还是事事微管理?要信任它的产出,还是每一条都得自己复核一遍?它到底是真把活干了,还是只是很自信地告诉你它干了?出了岔子,这账算谁的?这些问题,但凡带过实习生,你都不会陌生。微管理,你会被几百个 Agent 的进度淹死,那还不如自己干;彻底放手,你又随时可能在某个看不见的角落,被它默默捅出一个大窟窿。授权与失控之间那条线画在哪,是带人时最难的判断,换成带 Agent,一分没变,还得画得更准,因为它跑得更快。
还有出了事算谁的这个问题,在 Agent 这儿格外刺手。下属捅了篓子,至少责任还能分一分,他没听懂、你没讲清,各打五十大板。可 Agent 没有独立人格,它办砸的每一件事,最后都得记在那个设计循环、按下启动键的人头上,也就是你。这等于把责任进一步往 PM 这端集中了,你能指挥的范围更大了,能甩出去的锅,却更少了。权力和责任,从来是一起到货的。
所以loop 真正的难点从来不是工程,是管理。那些写 loop 的技术细节,网上的教程一抓一大把;真正决定一个 loop 是帮你省事还是替你挖坑的,是那些古老的、跟带人一模一样的管理判断。
而这支团队,还有一个比人类下属更棘手的毛病“装懂”。
一个新人不会的时候,至少会愣一下、会来问你、会说一句这个我不太确定。Agent 不会。它在你看不见的地方,把一件它其实没搞明白的事,办得无比流畅、措辞无比笃定、看起来无比权威,然后把一个错误的结果,自信满满地交到你手上。它们最可怕的地方,不是会犯错,而是犯错的时候,比谁都不带犹豫。带这样一支队伍,你得时刻提醒自己,它说做完了,和它真的做完了,是两件需要分开核实的事。
这毛病在 loop 里尤其要命,因为没人盯着。一个 Agent 可能在某一轮里,把一个根本没跑通的功能,在状态文件里写上已完成,下一轮就接着这个假前提往下盖楼,错误被一层层硬化成既定事实,等你发现,地基早歪了。带人的时候,你还能从一个人的眼神、语气里嗅出他在心虚;带 Agent,你唯一的依靠,是那道你提前设好的、铁面无私的验收门禁。它不会心虚,所以你得替它,把怀疑这件事做成制度。
你管人时的毛病,Agent 会无限放大
带过团队的人都知道一件事,你管理上的那些小漏洞,平时靠人的常识、默契、以及偶尔的将就,是能勉强糊弄过去的。一个需求没说清,靠谱的下属会自己脑补、会来追问。一笔预算没盯紧,月底总会有人提醒你快超了。
换成 Agent,这层缓冲没了。你所有的管理短板,都会被它以机器的速度和忠诚度,精确地、不知疲倦地,放大成真金白银的窟窿。
你要是验收标准定得含糊,后果立刻就来。人会替你兜底,Agent 不会,它要么因为不知道什么叫做完而停不下来,一轮一轮地空转烧钱;要么抓住一个它自以为达标的点就草草收工,交一个你压根不想要的东西。DoD 没写清,在带人时顶多是返工一次,在 loop 里是按秒计费的灾难。
你要是不敢设硬止损,账单会教你做人。一个 loop 不设上限地自己跑,你往往是收到账单或者被限流那一刻,才知道它跑了多远。所以 token 上限、迭代上限、时间上限,一个都不能省。而比设上限更重要的,是搞清楚到底该盯哪个指标,这里有个特别反直觉、也特别值钱的结论,别去数它烧了多少 token、开了多少个 PR、跑了多少轮,那些都是虚的。唯一有用的指标只有一个,叫每个被采纳的改动,平均花了你多少成本。如果一个 loop 交十个结果,你得扔掉六个,那它非但没替你省下评审的功夫,反而在制造返工。一个简单的及格线,被采纳率低于一半,这个 loop 就是在亏钱,赶紧收窄任务、修验收器,或者干脆关掉。成本从按次结算,悄悄变成了按轮结算,这是个经营问题,不是工程问题。
你要是图省事不读它的交付物,会欠下一笔最隐蔽的债。loop 合代码、出结果的速度越来越快,你对这摊东西的理解却越来越浅。这笔债有个名字,叫理解力债务。它的可怕之处在于,账单不是当场到的,真正还债的那天,是某个线上系统出了问题,你打开一看,发现这套已经跑了三个月的东西,全公司没有一个人完整读过。所以哪怕只是扫一眼,也得读那份改动。这跟你不能签字批准一份自己根本没看过的方案,是同一个道理。
你要是养成了照单全收的习惯,会丢掉最不该丢的判断。它交什么你信什么,久而久之,你就从一个做判断的人,退化成了一个点同意的人。这件事有个不留情面的说法,叫认知投降。
认知投降最隐蔽,因为它没有任何即时痛感,甚至感觉良好,每点一次同意,你都觉得自己在高效地推进工作。可这些被你一路放行的判断,会在某个时刻,汇成一个你既不理解、也无力收拾的烂摊子。一个团队最危险的状态,从来不是下属能力不行,而是领导停止思考、只负责盖章。Agent 把盖章这件事,变得前所未有地顺手,也前所未有地危险。
最后,还有一条铁律,是关于哪些活压根就不该交给 loop。判断密集、对错不清、依赖人来拍板的事,架构怎么定、鉴权怎么写、支付逻辑怎么设计、产品往哪个方向走——这些别让循环碰。loop 真正擅长的,是那些对错清晰、机器可验证、不需要人来权衡的活:自动修 lint、提依赖更新的 PR、给 CI 失败分类、复现偶发的测试。所以在你建任何一个 loop 之前,先拿四个问题筛一遍:这活重复发生吗?有机器能验收的标准吗?token 预算扛得住吗?给它配的工具够称职吗?四个全过,才值得建。建的时候顺序也别乱,先手动把它跑通一次,再固化成一个可复用的技能,然后才包进循环,最后才上定时,跳步是 loop 死在生产环境里最常见的死法。

这一长串看下来,你大概也咂摸出味了:上面没有一条是 AI 时代的新知识。它们全是带团队的老规矩,把活说清楚、自己的卷别自己判、重要的事写下来、花钱要有上限、交付物得过目、判断不能外包、把合适的活派给合适的人。区别只在于,过去你面对的是会偷懒、会糊弄、但也会替你兜底的人;现在你面对的是不会偷懒、绝对忠诚、但也绝不替你兜底的机器。机器把管理这件事,做了一次彻底的祛魅,它让你那些藏得很深的毛病,无处遁形。

永远外包不出去的那一部分
工程师们用四次范式跃迁:prompt、context、harness、loop,把产品经理这份工作里,能自动化的部分,几乎全自动化了。定义、拆解、验收、留存、管控、上报,这套循环正在一点点被代码接管。这是好事,它把你从大量重复的传话和盯梢里解放出来。
但有那么一部分,它怎么也接管不了。
就是那个没人写下来的判断。每一个工作流里,最有价值的,往往是那一个奇怪的、没被写进任何文档的决定,这个用户到底想要什么、这两个都对的方案该选哪个、这件事现在到底值不值得做。loop 能把这个决定周围所有的步骤都跑得飞快,唯独跑不了这个决定本身。它能替你执行,替不了你判断。
Addy Osmani 自己在那篇命名长文里就泼了盆冷水,大意是:两个人搭一个一模一样的 loop,能跑出完全相反的结果,一个用它去加速自己本就吃透的工作,另一个用它来逃避把工作吃透。循环不知道这俩有什么区别,你知道。所以他说,loop 设计这件事,比写提示词更难,而不是更容易。卡帕西讲得更狠,他在今年一场大会上引用过一句反复让他回想的话,你可以把思考外包出去,但你没法把理解外包出去。AI 能替你想办法,可你自己,得真的懂那个问题。这大概是整场 loop 狂欢里,最清醒的一句。
热词还会继续换。prompt 变成 context,context 变成 harness,harness 变成 loop,loop 这周火、下周就有人说它凉了,明年开春多半又是一个新名字。但每一个名字,命名的都只是那个机制,提示词、上下文、循环。它们底下那个一直没动的东西,是人对意图的定义,和对结果的判断。那才是真正的手艺,比任何一个循环都活得久。
这几年我们追的每一个热词,都是在给同一件事换包装,怎么更高效地把人的意图传达给一台机器,再确认它有没有照办。包装一年比一年精致,里头那颗内核,从 ChatGPT 刚出来到现在,一寸没动。看懂了这颗内核,你就不会被任何一个新名词唬住;看不懂也没关系,默默的把上个月刚学会的词从简历里删掉就可以了。
本文由 @发疯的超 原创发布于人人都是产品经理。未经作者许可,禁止转载
题图来自作者提供
- 目前还没评论,等你发挥!

起点课堂会员权益




