AI圈突然都在聊Loop Engineering，我想先泼点冷水

搜索

APP

起点课堂会员权益

职业体系课特权

线下行业大会特权

个人IP打造特权

30+门专项技能课

1300+专题课程

12场职场软技能直播

12场求职辅导直播

12场专业技能直播

会员专属社群

荣耀标识

发布

AI圈突然都在聊Loop Engineering，我想先泼点冷水

陈淀

2026-06-20

0 评论 75 浏览 0 收藏

17 分钟

Loop Engineering正在AI开发圈掀起一场思维革命。从Anthropic到Google，顶级工程师们纷纷抛弃传统prompt模式，转而设计AI驱动的自动化工作流。本文深度解析这一趋势如何从代码生成延伸到日常办公，揭示其背后的技术演进与潜在风险，并给出落地实践的黄金法则。

小陈最近在圈子里经常刷到一个新词——Loop Engineering。

怎么说呢，我最近刷推特的时候，感觉像是被这个词包围了。好像一夜之间，所有搞AI开发的朋友都在讨论。最开始是Peter Steinberger发了条推，大意是你不该再自己写prompt去驱动编程Agent了，应该去设计驱动Agent的循环。

好家伙，24小时就两百多万浏览，最后好像到了六百多万。紧接着，Anthropic那边负责Claude Code的Boris Cherny在一个播客里说，他现在都不自己prompt了，他的工作变成了写循环。再然后，Google的Addy Osmani专门写了篇长文，把这事儿系统地给讲了一遍，还给了个名字——Loop Engineering。

我当时的第一反应是：哈？这不就是定时任务吗？换个马甲我又不认识了？我甚至有点阴谋论地想，这该不会是新一轮的“造词运动”吧，为了卖课或者显得自己很前沿。

但后来我仔细琢磨了一下，发现事情没那么简单。三个不同公司的顶级从业者，在同一周得出几乎一样的结论，这绝对不是巧合。就像你身边三个不同行业的朋友，突然都跟你说同一家新开的馆子特别好吃，你很难不去试一试。

一、我理解的Loop Engineering

让我试着用我自己的话来说说它到底是个啥。

以前我们用AI，尤其是用它写代码，是一个“你来我往”的过程。你发一个指令，它执行一段；你看看结果，不满意再换个说法，或者给点补充信息，它再改。这个过程中，你的注意力是全程在线的，你就是那个驾驶员。

Loop Engineering想说的是，对于某些任务，你能不能别当驾驶员了，去当个汽车设计师或者赛道规划师？

你设计一个“循环”或者说“流程”，这个流程会自动地、一遍又一遍地去问AI：“目标是什么？现在进展到哪一步了？下一步该干嘛？”AI根据流程的指示去行动、去思考、去执行。整个流程有自己检查结果、判断是否完成的机制。你只需要在开始时定义好目标，在结束后接收结果，中间过程可以不用一直盯着。

我举个我自己的小例子，可能不太高级，但很直观。我每天要处理很多邮件和消息，以前我都是手动复制粘贴内容，让AI帮我分类、拟回复。现在呢，我花了点时间，用一个工具写了个简单的脚本。每天早上它会自动抓取我收件箱里未读的邮件，按规则分类，对一些常规咨询自动生成回复草稿，然后把需要我本人决策的重要邮件和自动生成的草稿一起整理好，推送到我的待办清单里。我每天只需要花十分钟审核一下草稿，点一下发送，重要的邮件再仔细看看。

你看，这个“自动抓取-分类-生成草稿-推送”的过程，就是一个最简单的Loop。它替代了我每天重复的手动操作。我的角色从一个执行者，变成了规则的设计者和结果的审核者。

二、为什么我觉得它不只是“带帽子的cron job”

我一开始怀疑它是新瓶装旧酒，这一点毛病没有。甚至Reddit上很多人也这么说，觉得这就是定时任务加点AI。

但关键区别在哪呢？我觉得在于决策点。

传统的cron job，你给它一个脚本，它就每天定时、定量地跑。脚本里如果写的是“打开A网站，抓取B数据，存到C表格”，那它就永远干这个。如果A网站改版了，脚本挂了，它就傻了，只知道报错。

但一个设计良好的Loop，它的每一步，执行什么、怎么执行，都是由模型根据当前状态实时决定的。它不是在执行死板的脚本，它是在“思考”然后“行动”。

比如，同样是维护一个代码仓库的循环。传统的脚本可能就是“每天凌晨运行测试，失败就发邮件告警”。而一个Loop可能会这样做：早上自动拉取昨天失败的CI日志，AI读一遍，判断是测试用例写烂了还是代码真有bug；如果是用例问题，它可能会尝试去修复用例；如果是代码bug，它会去定位问题代码，尝试修复，然后运行测试验证；如果自己搞不定，它会把问题和它尝试过的路径整理好，作为一条带背景的工单，放到你的待办事项里，而不是发一封干巴巴的告警邮件。

看出区别了吧？一个是有脑子的，一个是没有的。所以把Loop Engineering简单看作cron job，就像把智能手机看作能打电话的MP3播放器一样，是没抓住本质。

三、它的骨架长啥样？

Addy Osmani的文章里把它拆解得很清楚，我觉得总结得特别好。一个完整的Loop，需要几个核心部件，就像一辆车要有发动机、底盘、轮胎、刹车一样。

首先是触发器。你的Loop是每天定时跑，还是某个事件发生时跑？比如，有人提交了代码，或者监控报警了，它就启动。

然后是隔离的工作区。这点很重要！如果让多个AI Agent同时改同一个文件，那不乱套了吗？所以需要给它们各自一块独立的、互不干扰的工作区域，最后再合并。

接下来是项目知识库。你不能让AI每次工作都从零开始学习你的代码规范和架构吧？你得把项目的规范、设计文档、常见问题写成一份份“技能文件”，让AI开工前先熟读这些。这样它干的活才不会离谱。

外部连接器也很关键。AI光会想不行，得能干活。它得能读写文件，操作GitHub，调用Slack发通知。这些都需要通过标准化的接口（比如MCP）去连接。

最有意思的是子Agent。让写代码的AI和检查代码的AI是同一个“人”，这肯定不行。所以通常会拆分，一个负责实现功能，另一个负责审查和测试，甚至可以用更强的模型来做检查者。

最后，也是最容易被忽视的，记忆和状态。模型自己的上下文窗口是有限的，聊着聊着它就忘了前面。所以需要把关键的进度、状态、犯过的错，记录在一个外部的文件里。每次循环开始，它先读取这个状态文件，知道自己从哪儿来，要到哪儿去。

四、为啥现在突然火了？

任何技术趋势爆发，都不是空穴来风。Loop Engineering也是，它的成熟需要几个条件同时具备。

第一个条件，上下文窗口够大了。早些年的AI模型，记忆像个筛子，你前面说的话，聊多了它就忘了。现在有些模型的上下文能达到百万token级别，这意味着它可以一次性“看”完一个中小型项目的代码库，或者记住很长一段任务历史。这是它能理解复杂任务、进行多步工作的基础。

第二个条件，推理成本下来了。让AI模型多跑几轮、多想几次，是要烧钱的。以前API调用一次挺贵的，让它循环起来，账单可能很恐怖。但现在成本在持续下降，多跑几轮从“奢侈消费”变成了“可接受的运营成本”。这才是Loop能在生产环境里用起来的经济前提。

第三个条件，编程Agent本身能用了。模型变聪明了，能处理的编程任务更复杂了，能从自己的错误里学习恢复了，产出的东西能达到生产级别的审查标准了。这就引出了一个瓶颈转移：当单次AI执行就能干很多活的时候，我们工程师的高杠杆操作，就不再是琢磨怎么写出更精妙的prompt了，而是去设计一个能让这个强大的AI稳定、高效、可验证地持续工作的“流程”或“系统”。

五、但，它是银弹吗？

聊到这里，你可能觉得这东西太美好了。但我得泼点冷水，聊聊我看到的、想到的那些坑。

第一个坑，烧钱黑洞。Reddit上真有开发者晒账单，一晚上Loop自动运行，几百美元的Token费就没了，肉疼。对于个人开发者或者小团队，这绝对是要谨慎的。我的建议是，初期一定要设置硬性的预算上限，并且手动触发，别轻易让它无人值守地跑。

第二个坑，理解债务。这个词是我想的，但我觉得特别贴切。什么叫理解债务？就是代码被Loop自动生成，被自动合并，但没有人（包括你自己）真正去读过它，理解它。短期内，效率飞起，项目推进极快。但长期来看，你对系统是如何工作的，积累了大量的“不理解”。一旦出问题，排查起来如同大海捞针。有份报告里说，随着AI采用率提高，开发者人均bug数上升了54%，近三分之一的代码是无人审查就进生产环境的。这数据挺吓人的。Loop可能会加速这个过程。

第三个坑，目标模糊是致命的。Loop适合处理“目标清晰、可验证”的任务。比如，“让所有测试通过”、“修复这个已知的Bug”。但如果你想用它来“想想更好的产品策略”或者“写一个很有创意的营销文案”，大概率会翻车。因为AI不知道“更好”和“创意”到底是什么标准，它可能会在一个模糊的指令下无休止地运行、修改，产出的东西反而更糟。在让AI跑起来之前，你可能得先和你的团队喝杯咖啡，把那个模糊的目标，聊成清晰、可衡量的几条标准。

第四个坑，你变懒了。这可能是最大的风险。当Loop跑得太顺，你会越来越依赖它，越来越不愿意去深入理解代码细节。你的技能可能会退化。有一天Loop失效了，你可能发现自己已经不会“从头开始”了。技术人的核心价值，永远不能是某个工具的熟练操作员，而应该是解决问题的深度理解和架构能力。