Stripe 的 AI 小黄人军团：每周 1300+ 个需求全自动开发背后的秘密

搜索

APP

起点课堂会员权益

职业体系课特权

线下行业大会特权

个人IP打造特权

30+门专项技能课

1300+专题课程

12场职场软技能直播

12场求职辅导直播

12场专业技能直播

会员专属社群

荣耀标识

发布

Stripe 的 AI 小黄人军团：每周 1300+ 个需求全自动开发背后的秘密

Ceelog

2026-03-02

1 评论 4154 浏览 4 收藏

12 分钟

当全球企业还在探索AI辅助编程的可能性时，Stripe已经悄然开启了无人值守编程的新纪元。1300+个由AI代理Minion完全生成的Pull Request每周合并，标志着一个软件工程新范式的诞生。本文将深入拆解Stripe如何构建Devbox基础设施、Blueprints约束框架和MCP上下文协议，揭示这场生产力革命的底层逻辑与未来启示。

当大多数公司还在讨论“AI 辅助编程”时，全球支付巨头 Stripe 已经悄悄迈入了一个新阶段：无人值守编程（Unattended Coding）。

就在上周，Stripe 的工程博客透露了一个令人咋舌的数据：

“Stripe 每周有超过 1300+ 个合并的 Pull Request 是完全由 Minion 生成的，虽然它们经过了人工审查，但其中没有一行是人类手写的。”

这不仅仅是效率的提升，这是软件工程范式的彻底转变。对于老板来说，这是巨大的希望；对于还在写 CRUD 的程序员来说，这可能是真实的恐慌。

第一部分：现实的暴击——它不再是玩具

让我们先打破一个幻想：AI 编程不再是那种“写个贪吃蛇游戏”或者“解释一下这段代码”的玩具了。

正如 Stripe 博客所言：

“凭感觉（Vibe coding）从头写一个原型，与向 Stripe 的代码库贡献代码有着根本的不同。”

在 Stripe，这些被称为 “Minions”（小黄人） 的 AI 代理，正在干着实实在在的活。

它们是怎么工作的？

想象一下这个场景：你正在 Slack 上讨论一个功能。你不需要切到 IDE，只需要在 Slack 线程里 @Minion。

图注：工程师在 Slack 中直接调用 Minion 开始工作

Minion 会读取整个对话上下文，理解问题，然后独自去干活。

“一个典型的 Minion 运行始于一条 Slack 消息，终于一个通过 CI 并准备好审查的 PR，中间没有任何人类互动。”

不仅仅是 Slack，Minions 还集成在 Stripe 的内部系统中。例如，当 CI 系统检测到不稳定的测试（Flaky Test）时，会自动创建一个工单，并附带一个按钮——“启动 Minion 修复它”。

图注：一个带有“启动 Minion”按钮的 Flaky Test 工单

整个过程，人类工程师完全不需要介入，直到最后一步——Code Review。工程师甚至可以在 Web UI 上看到 Minion 的每一步决策和行动。

图注：管理 Minion 运行的 Web 界面

这听起来是不是很像你一直想要的那个“靠谱的实习生”？而且这个实习生不需要睡觉，随叫随到，还能并发处理几百个任务。

为什么这让人恐慌？

因为“完成任务”（Task Completion）和“辅助编程”（Copilot）是两个维度的概念。Copilot 只是让你的打字速度变快了，你还是驾驶员。Minions 是自动驾驶。虽然现在还需要你坐在驾驶位上盯着，但方向盘已经不在你手里了。

如果 AI 能独立完成 1300+ 个 PR，那么那些只会写样板代码、只会修修补补的工程师，价值还剩多少？

第二部分：揭秘黑科技——Stripe 是怎么做到的？

你可能会问：“我也用了 Cursor/Claude，为什么做不到这种程度？”因为这不仅仅是模型能力的问题，更是工程架构的问题。Stripe 为了让 Minions 跑起来，构建了一套惊人的基础设施。

1. 瞬间启动的“一次性”开发环境 (Devbox)

AI 代理最大的问题是环境污染。如果两个 AI 在同一个环境里改代码，肯定会打架。而且，你敢让 AI 直接操作你的笔记本电脑吗？

Stripe 的解决方案是：Devbox。

这是一套基于 AWS EC2 的开发环境。关键在于，它们是“即用即抛”（Cattle, not pets）。

“用 DevOps 的术语来说，Devbox 是‘即用即抛’：它们是标准化的、易于替换的，而不是定制的、长寿的。”

Stripe 预热了一个巨大的 Devbox 池。当 Minion 需要干活时，10 秒钟内就能分配到一个全新的、预装了所有代码和依赖的环境。在这个隔离的沙盒里，Minion 拥有 root 权限，可以随意折腾。

“对人类好的，对 LLM 也好。”

Stripe 早就为人类工程师建立了这套系统，现在它成了 AI 爆发的基石。

2. 蓝图 (Blueprints)：给 AI 装上“理性的缰绳”

纯粹的 AI 是不可控的。你让它“修个 bug”，它可能给你写出一首诗，或者改了不该改的文件。Stripe 基于开源的 goose 代理进行了魔改，并发明了 “Blueprints”（蓝图） 来约束 AI。

图注：蓝图示例。矩形代表确定性节点，云朵形状代表 AI 代理子任务

蓝图是一种混合工作流，它像一个状态机：

“蓝图结合了工作流的确定性与代理处理未知情况的灵活性。”

确定性节点（方块）： 比如“运行 Linter”、“Git Push”。这些步骤是写死的代码，绝对执行，不容 AI 自由发挥。
AI 代理节点（云朵）： 比如“实现功能”、“修复 CI 错误”。这些步骤交给 LLM 去思考和决策。

这种 “三明治结构”（确定性代码夹着 AI 思考）极其聪明。它既利用了 AI 的创造力，又保证了工程的严谨性。

3. 上下文为王：MCP 与 Toolshed

AI 只有在“懂你”的时候才有用。Stripe 的代码库有数亿行，AI 怎么知道该看哪里？

Stripe 采用了 MCP (Model Context Protocol) 标准，并建立了一个名为 Toolshed 的内部服务器。Toolshed 里有 400 多个工具！Minion 可以通过这些工具去查内部文档、看 Jira 票据、搜索代码、甚至查看 CI 状态。

4. Shift Left：极其克制的 CI 策略

AI 写完代码，怎么保证是对的？跑 CI（持续集成）测试。但是，CI 是昂贵的。Stripe 的策略非常务实：“最多跑两轮”。

“我们寻求‘反馈左移’……如果任何 Lint 步骤会在 CI 中失败，最好是在 IDE 中或 Git Push 时就强制执行。”

Minion 本地跑 Linter 和部分测试（毫秒级反馈）。
推送到 CI，如果有错误且有自动修复（Autofix），自动应用。
如果还有错误，Minion 尝试修复一次，再推一次。
如果还不行？停止。交给人类。

第三部分：希望——人类工程师的新角色

读到这里，你可能觉得：“完了，我以后是不是只能给 AI 打工了？”

别急，Stripe 的实践反而给了我们一个极其重要的启示：AI 倒逼了工程质量的提升。

你的新职位：架构师与审查者

Minions 的出现，并没有让 Stripe 裁掉工程师，而是改变了工程师的工作内容。你不再是一个“代码打字员”（Coder），你变成了一个 “系统架构师” 和 “代码审查者”。

你需要做的是：

定义问题： 清晰地描述任务（Prompt Engineering）。
制定规则： 编写 Rule 文件和 Blueprints，告诉 AI 什么是“好代码”。
审查结果： 拥有最终的决定权，判断 AI 的产出是否符合业务逻辑。

这其实提高了对工程师的要求。你必须懂原理，懂架构，才能驾驭这支 AI 军团。

结语：门槛在降低，天花板在上升

Stripe 的 Minions 告诉我们，软件工程的“地板”正在下沉——写出能跑的代码变得越来越容易，甚至不需要人来写。但同时，“天花板”正在急剧上升——管理大规模 AI 协作、设计高可用的基础设施、构建复杂的业务逻辑，这些挑战变得更加宏大。

给老板的建议：不要只盯着 AI 能省多少人头费。看看 Stripe，他们投入了巨大的资源建设 Devbox、Toolshed 和测试基础设施。没有这些厚重的基建，AI 只是一个只会胡说八道的聊天机器人。投资你的开发者体验（DevEx），就是投资你的 AI 未来。
给程序员的建议：停止死记硬背 API。开始学习如何写清晰的文档（给 AI 看），如何写健壮的测试（给 AI 跑），如何设计模块化的架构（给 AI 维护）。学会当一个“包工头”，而不是那个搬砖的人。

未来已来，你是选择被恐慌吞噬，还是开始打造自己的 AI Minions 军团，去征服更大的星辰大海？

本文由 @Ceelog 原创发布于人人都是产品经理。未经作者许可，禁止转载

题图来自作者提供

更多精彩内容，请关注人人都是产品经理微信公众号或下载App