Stripe 的 AI 小黄人军团:每周 1300+ 个需求全自动开发背后的秘密

0 评论 342 浏览 0 收藏 12 分钟

当全球企业还在探索AI辅助编程的可能性时,Stripe已经悄然开启了无人值守编程的新纪元。1300+个由AI代理Minion完全生成的Pull Request每周合并,标志着一个软件工程新范式的诞生。本文将深入拆解Stripe如何构建Devbox基础设施、Blueprints约束框架和MCP上下文协议,揭示这场生产力革命的底层逻辑与未来启示。

当大多数公司还在讨论“AI 辅助编程”时,全球支付巨头 Stripe 已经悄悄迈入了一个新阶段:无人值守编程(Unattended Coding)

就在上周,Stripe 的工程博客透露了一个令人咋舌的数据:

“Stripe 每周有超过 1300+ 个合并的 Pull Request 是完全由 Minion 生成的,虽然它们经过了人工审查,但其中没有一行是人类手写的。”

这不仅仅是效率的提升,这是软件工程范式的彻底转变。对于老板来说,这是巨大的希望;对于还在写 CRUD 的程序员来说,这可能是真实的恐慌。

第一部分:现实的暴击——它不再是玩具

让我们先打破一个幻想:AI 编程不再是那种“写个贪吃蛇游戏”或者“解释一下这段代码”的玩具了。

正如 Stripe 博客所言:

“凭感觉(Vibe coding)从头写一个原型,与向 Stripe 的代码库贡献代码有着根本的不同。”

在 Stripe,这些被称为 “Minions”(小黄人) 的 AI 代理,正在干着实实在在的活。

它们是怎么工作的?

想象一下这个场景:你正在 Slack 上讨论一个功能。你不需要切到 IDE,只需要在 Slack 线程里 @Minion。

图注:工程师在 Slack 中直接调用 Minion 开始工作

Minion 会读取整个对话上下文,理解问题,然后独自去干活。

“一个典型的 Minion 运行始于一条 Slack 消息,终于一个通过 CI 并准备好审查的 PR,中间没有任何人类互动。”

不仅仅是 Slack,Minions 还集成在 Stripe 的内部系统中。例如,当 CI 系统检测到不稳定的测试(Flaky Test)时,会自动创建一个工单,并附带一个按钮——“启动 Minion 修复它”。

图注:一个带有“启动 Minion”按钮的 Flaky Test 工单

整个过程,人类工程师完全不需要介入,直到最后一步——Code Review。工程师甚至可以在 Web UI 上看到 Minion 的每一步决策和行动。

图注:管理 Minion 运行的 Web 界面

这听起来是不是很像你一直想要的那个“靠谱的实习生”?而且这个实习生不需要睡觉,随叫随到,还能并发处理几百个任务。

为什么这让人恐慌?

因为“完成任务”(Task Completion)和“辅助编程”(Copilot)是两个维度的概念。Copilot 只是让你的打字速度变快了,你还是驾驶员。Minions 是自动驾驶。虽然现在还需要你坐在驾驶位上盯着,但方向盘已经不在你手里了。

如果 AI 能独立完成 1300+ 个 PR,那么那些只会写样板代码、只会修修补补的工程师,价值还剩多少?

第二部分:揭秘黑科技——Stripe 是怎么做到的?

你可能会问:“我也用了 Cursor/Claude,为什么做不到这种程度?”因为这不仅仅是模型能力的问题,更是工程架构的问题。Stripe 为了让 Minions 跑起来,构建了一套惊人的基础设施。

1. 瞬间启动的“一次性”开发环境 (Devbox)

AI 代理最大的问题是环境污染。如果两个 AI 在同一个环境里改代码,肯定会打架。而且,你敢让 AI 直接操作你的笔记本电脑吗?

Stripe 的解决方案是:Devbox

这是一套基于 AWS EC2 的开发环境。关键在于,它们是“即用即抛”(Cattle, not pets)。

“用 DevOps 的术语来说,Devbox 是‘即用即抛’:它们是标准化的、易于替换的,而不是定制的、长寿的。”

Stripe 预热了一个巨大的 Devbox 池。当 Minion 需要干活时,10 秒钟内就能分配到一个全新的、预装了所有代码和依赖的环境。在这个隔离的沙盒里,Minion 拥有 root 权限,可以随意折腾。

“对人类好的,对 LLM 也好。”

Stripe 早就为人类工程师建立了这套系统,现在它成了 AI 爆发的基石。

2. 蓝图 (Blueprints):给 AI 装上“理性的缰绳”

纯粹的 AI 是不可控的。你让它“修个 bug”,它可能给你写出一首诗,或者改了不该改的文件。Stripe 基于开源的 goose 代理进行了魔改,并发明了 “Blueprints”(蓝图) 来约束 AI。

图注:蓝图示例。矩形代表确定性节点,云朵形状代表 AI 代理子任务

蓝图是一种混合工作流,它像一个状态机:

“蓝图结合了工作流的确定性与代理处理未知情况的灵活性。”

  • 确定性节点(方块): 比如“运行 Linter”、“Git Push”。这些步骤是写死的代码,绝对执行,不容 AI 自由发挥。
  • AI 代理节点(云朵): 比如“实现功能”、“修复 CI 错误”。这些步骤交给 LLM 去思考和决策。

这种 “三明治结构”(确定性代码夹着 AI 思考)极其聪明。它既利用了 AI 的创造力,又保证了工程的严谨性。

3. 上下文为王:MCP 与 Toolshed

AI 只有在“懂你”的时候才有用。Stripe 的代码库有数亿行,AI 怎么知道该看哪里?

Stripe 采用了 MCP (Model Context Protocol) 标准,并建立了一个名为 Toolshed 的内部服务器。Toolshed 里有 400 多个工具!Minion 可以通过这些工具去查内部文档、看 Jira 票据、搜索代码、甚至查看 CI 状态。

4. Shift Left:极其克制的 CI 策略

AI 写完代码,怎么保证是对的?跑 CI(持续集成)测试。但是,CI 是昂贵的。Stripe 的策略非常务实:“最多跑两轮”

“我们寻求‘反馈左移’……如果任何 Lint 步骤会在 CI 中失败,最好是在 IDE 中或 Git Push 时就强制执行。”

  1. Minion 本地跑 Linter 和部分测试(毫秒级反馈)。
  2. 推送到 CI,如果有错误且有自动修复(Autofix),自动应用。
  3. 如果还有错误,Minion 尝试修复一次,再推一次。
  4. 如果还不行?停止。交给人类。

第三部分:希望——人类工程师的新角色

读到这里,你可能觉得:“完了,我以后是不是只能给 AI 打工了?”

别急,Stripe 的实践反而给了我们一个极其重要的启示:AI 倒逼了工程质量的提升。

你的新职位:架构师与审查者

Minions 的出现,并没有让 Stripe 裁掉工程师,而是改变了工程师的工作内容。你不再是一个“代码打字员”(Coder),你变成了一个 “系统架构师”“代码审查者”

你需要做的是:

  1. 定义问题: 清晰地描述任务(Prompt Engineering)。
  2. 制定规则: 编写 Rule 文件和 Blueprints,告诉 AI 什么是“好代码”。
  3. 审查结果: 拥有最终的决定权,判断 AI 的产出是否符合业务逻辑。

这其实提高了对工程师的要求。你必须懂原理,懂架构,才能驾驭这支 AI 军团。

结语:门槛在降低,天花板在上升

Stripe 的 Minions 告诉我们,软件工程的“地板”正在下沉——写出能跑的代码变得越来越容易,甚至不需要人来写。但同时,“天花板”正在急剧上升——管理大规模 AI 协作、设计高可用的基础设施、构建复杂的业务逻辑,这些挑战变得更加宏大。

  • 给老板的建议:不要只盯着 AI 能省多少人头费。看看 Stripe,他们投入了巨大的资源建设 Devbox、Toolshed 和测试基础设施。没有这些厚重的基建,AI 只是一个只会胡说八道的聊天机器人。投资你的开发者体验(DevEx),就是投资你的 AI 未来。
  • 给程序员的建议:停止死记硬背 API。开始学习如何写清晰的文档(给 AI 看),如何写健壮的测试(给 AI 跑),如何设计模块化的架构(给 AI 维护)。学会当一个“包工头”,而不是那个搬砖的人。

未来已来,你是选择被恐慌吞噬,还是开始打造自己的 AI Minions 军团,去征服更大的星辰大海?

本文由 @Ceelog 原创发布于人人都是产品经理。未经作者许可,禁止转载

题图来自作者提供

更多精彩内容,请关注人人都是产品经理微信公众号或下载App
评论
评论请登录
  1. 目前还没评论,等你发挥!