AI圈突然都在聊Loop Engineering,我想先泼点冷水
Loop Engineering正在AI开发圈掀起一场思维革命。从Anthropic到Google,顶级工程师们纷纷抛弃传统prompt模式,转而设计AI驱动的自动化工作流。本文深度解析这一趋势如何从代码生成延伸到日常办公,揭示其背后的技术演进与潜在风险,并给出落地实践的黄金法则。

小陈最近在圈子里经常刷到一个新词——Loop Engineering。
怎么说呢,我最近刷推特的时候,感觉像是被这个词包围了。好像一夜之间,所有搞AI开发的朋友都在讨论。最开始是Peter Steinberger发了条推,大意是你不该再自己写prompt去驱动编程Agent了,应该去设计驱动Agent的循环。
好家伙,24小时就两百多万浏览,最后好像到了六百多万。紧接着,Anthropic那边负责Claude Code的Boris Cherny在一个播客里说,他现在都不自己prompt了,他的工作变成了写循环。再然后,Google的Addy Osmani专门写了篇长文,把这事儿系统地给讲了一遍,还给了个名字——Loop Engineering。
我当时的第一反应是:哈?这不就是定时任务吗?换个马甲我又不认识了?我甚至有点阴谋论地想,这该不会是新一轮的“造词运动”吧,为了卖课或者显得自己很前沿。
但后来我仔细琢磨了一下,发现事情没那么简单。三个不同公司的顶级从业者,在同一周得出几乎一样的结论,这绝对不是巧合。就像你身边三个不同行业的朋友,突然都跟你说同一家新开的馆子特别好吃,你很难不去试一试。
一、我理解的Loop Engineering
让我试着用我自己的话来说说它到底是个啥。
以前我们用AI,尤其是用它写代码,是一个“你来我往”的过程。你发一个指令,它执行一段;你看看结果,不满意再换个说法,或者给点补充信息,它再改。这个过程中,你的注意力是全程在线的,你就是那个驾驶员。
Loop Engineering想说的是,对于某些任务,你能不能别当驾驶员了,去当个汽车设计师或者赛道规划师?
你设计一个“循环”或者说“流程”,这个流程会自动地、一遍又一遍地去问AI:“目标是什么?现在进展到哪一步了?下一步该干嘛?”AI根据流程的指示去行动、去思考、去执行。整个流程有自己检查结果、判断是否完成的机制。你只需要在开始时定义好目标,在结束后接收结果,中间过程可以不用一直盯着。
我举个我自己的小例子,可能不太高级,但很直观。我每天要处理很多邮件和消息,以前我都是手动复制粘贴内容,让AI帮我分类、拟回复。现在呢,我花了点时间,用一个工具写了个简单的脚本。每天早上它会自动抓取我收件箱里未读的邮件,按规则分类,对一些常规咨询自动生成回复草稿,然后把需要我本人决策的重要邮件和自动生成的草稿一起整理好,推送到我的待办清单里。我每天只需要花十分钟审核一下草稿,点一下发送,重要的邮件再仔细看看。
你看,这个“自动抓取-分类-生成草稿-推送”的过程,就是一个最简单的Loop。它替代了我每天重复的手动操作。我的角色从一个执行者,变成了规则的设计者和结果的审核者。

二、为什么我觉得它不只是“带帽子的cron job”
我一开始怀疑它是新瓶装旧酒,这一点毛病没有。甚至Reddit上很多人也这么说,觉得这就是定时任务加点AI。
但关键区别在哪呢?我觉得在于决策点。
传统的cron job,你给它一个脚本,它就每天定时、定量地跑。脚本里如果写的是“打开A网站,抓取B数据,存到C表格”,那它就永远干这个。如果A网站改版了,脚本挂了,它就傻了,只知道报错。
但一个设计良好的Loop,它的每一步,执行什么、怎么执行,都是由模型根据当前状态实时决定的。它不是在执行死板的脚本,它是在“思考”然后“行动”。
比如,同样是维护一个代码仓库的循环。传统的脚本可能就是“每天凌晨运行测试,失败就发邮件告警”。而一个Loop可能会这样做:早上自动拉取昨天失败的CI日志,AI读一遍,判断是测试用例写烂了还是代码真有bug;如果是用例问题,它可能会尝试去修复用例;如果是代码bug,它会去定位问题代码,尝试修复,然后运行测试验证;如果自己搞不定,它会把问题和它尝试过的路径整理好,作为一条带背景的工单,放到你的待办事项里,而不是发一封干巴巴的告警邮件。
看出区别了吧?一个是有脑子的,一个是没有的。所以把Loop Engineering简单看作cron job,就像把智能手机看作能打电话的MP3播放器一样,是没抓住本质。

三、它的骨架长啥样?
Addy Osmani的文章里把它拆解得很清楚,我觉得总结得特别好。一个完整的Loop,需要几个核心部件,就像一辆车要有发动机、底盘、轮胎、刹车一样。
首先是触发器。你的Loop是每天定时跑,还是某个事件发生时跑?比如,有人提交了代码,或者监控报警了,它就启动。
然后是隔离的工作区。这点很重要!如果让多个AI Agent同时改同一个文件,那不乱套了吗?所以需要给它们各自一块独立的、互不干扰的工作区域,最后再合并。
接下来是项目知识库。你不能让AI每次工作都从零开始学习你的代码规范和架构吧?你得把项目的规范、设计文档、常见问题写成一份份“技能文件”,让AI开工前先熟读这些。这样它干的活才不会离谱。
外部连接器也很关键。AI光会想不行,得能干活。它得能读写文件,操作GitHub,调用Slack发通知。这些都需要通过标准化的接口(比如MCP)去连接。
最有意思的是子Agent。让写代码的AI和检查代码的AI是同一个“人”,这肯定不行。所以通常会拆分,一个负责实现功能,另一个负责审查和测试,甚至可以用更强的模型来做检查者。
最后,也是最容易被忽视的,记忆和状态。模型自己的上下文窗口是有限的,聊着聊着它就忘了前面。所以需要把关键的进度、状态、犯过的错,记录在一个外部的文件里。每次循环开始,它先读取这个状态文件,知道自己从哪儿来,要到哪儿去。

四、为啥现在突然火了?
任何技术趋势爆发,都不是空穴来风。Loop Engineering也是,它的成熟需要几个条件同时具备。
第一个条件,上下文窗口够大了。早些年的AI模型,记忆像个筛子,你前面说的话,聊多了它就忘了。现在有些模型的上下文能达到百万token级别,这意味着它可以一次性“看”完一个中小型项目的代码库,或者记住很长一段任务历史。这是它能理解复杂任务、进行多步工作的基础。
第二个条件,推理成本下来了。让AI模型多跑几轮、多想几次,是要烧钱的。以前API调用一次挺贵的,让它循环起来,账单可能很恐怖。但现在成本在持续下降,多跑几轮从“奢侈消费”变成了“可接受的运营成本”。这才是Loop能在生产环境里用起来的经济前提。
第三个条件,编程Agent本身能用了。模型变聪明了,能处理的编程任务更复杂了,能从自己的错误里学习恢复了,产出的东西能达到生产级别的审查标准了。这就引出了一个瓶颈转移:当单次AI执行就能干很多活的时候,我们工程师的高杠杆操作,就不再是琢磨怎么写出更精妙的prompt了,而是去设计一个能让这个强大的AI稳定、高效、可验证地持续工作的“流程”或“系统”。

五、但,它是银弹吗?
聊到这里,你可能觉得这东西太美好了。但我得泼点冷水,聊聊我看到的、想到的那些坑。
第一个坑,烧钱黑洞。Reddit上真有开发者晒账单,一晚上Loop自动运行,几百美元的Token费就没了,肉疼。对于个人开发者或者小团队,这绝对是要谨慎的。我的建议是,初期一定要设置硬性的预算上限,并且手动触发,别轻易让它无人值守地跑。
第二个坑,理解债务。这个词是我想的,但我觉得特别贴切。什么叫理解债务?就是代码被Loop自动生成,被自动合并,但没有人(包括你自己)真正去读过它,理解它。短期内,效率飞起,项目推进极快。但长期来看,你对系统是如何工作的,积累了大量的“不理解”。一旦出问题,排查起来如同大海捞针。有份报告里说,随着AI采用率提高,开发者人均bug数上升了54%,近三分之一的代码是无人审查就进生产环境的。这数据挺吓人的。Loop可能会加速这个过程。
第三个坑,目标模糊是致命的。Loop适合处理“目标清晰、可验证”的任务。比如,“让所有测试通过”、“修复这个已知的Bug”。但如果你想用它来“想想更好的产品策略”或者“写一个很有创意的营销文案”,大概率会翻车。因为AI不知道“更好”和“创意”到底是什么标准,它可能会在一个模糊的指令下无休止地运行、修改,产出的东西反而更糟。在让AI跑起来之前,你可能得先和你的团队喝杯咖啡,把那个模糊的目标,聊成清晰、可衡量的几条标准。
第四个坑,你变懒了。这可能是最大的风险。当Loop跑得太顺,你会越来越依赖它,越来越不愿意去深入理解代码细节。你的技能可能会退化。有一天Loop失效了,你可能发现自己已经不会“从头开始”了。技术人的核心价值,永远不能是某个工具的熟练操作员,而应该是解决问题的深度理解和架构能力。
六、那么,到底要不要用它?
我个人的看法是,用,但要聪明地用,有选择地用。
什么样的任务适合上Loop?
- 重复性高:每天、每周都要做的。
- 规则明确:输入、输出、成功标准都很清楚。
- 有可靠的验证方式:最好能用自动化测试、类型检查、编译来验证结果。
- 举个例子:代码仓库的日常维护、标准化的数据清洗、定期报告的生成、一些重复性的运维检查。
什么样的任务最好别碰?
- 探索性、创造性强的:产品早期原型、艺术创作、战略构思。
- 目标极其模糊的:“优化用户体验”、“提升代码质量”这种。
- 后果严重且难以回滚的:核心金融系统、关键基础设施的改动。
我的实践法则是:从最小、最安全的Loop开始。先找一个痛点最明显的重复性任务,设计一个简单的循环,加上最严格的预算限制和人工审核环节,小范围跑起来。看看效果,踩踩坑,积累经验。不要一上来就搞全自动、无人化的复杂流程。
最后说两句

Loop Engineering对我来说,感觉像是AI应用从“手工作坊”进入“小工厂”时代的一个标志。我们不再是亲自抡大锤的工匠,而是开始设计机床和流水线的工程师。
这既是解放,也是挑战。解放的是我们的重复劳动,挑战的是我们的系统设计能力、风险评估能力和保持技术深度的自律。
它不是魔法,不是银弹,更不是让你变懒的借口。它是一个工具,一个强大但需要精心驾驭的工具。用得好,它能帮你把精力聚焦在真正有创造性的工作上;用不好,它可能给你埋下意想不到的巨坑。
所以,如果你也听到了这个风声,别光顾着兴奋。先问问自己:我有哪些重复劳动是真的需要自动化?我能把那个任务的目标定义得足够清晰吗?我有没有可靠的验证方法?想清楚这些,再决定要不要开始设计你的第一个Loop。
毕竟,在这个AI快速迭代的时代,保持独立思考和清醒判断,可能比掌握任何一个新名词都更重要。你说是吧?
本文由 @陈淀 原创发布于人人都是产品经理。未经作者许可,禁止转载
题图来自Unsplash,基于CC0协议
该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务
- 目前还没评论,等你发挥!

起点课堂会员权益




