下一场革命：Vibe Engineering｜OpenAI 内部分享 | 人人都是产品经理

APP

起点课堂会员权益

职业体系课特权

线下行业大会特权

个人IP打造特权

30+门专项技能课

1300+专题课程

12场职场软技能直播

12场求职辅导直播

12场专业技能直播

会员专属社群

荣耀标识

{{ userInfo.member ? '查看权益' : '开通会员' }}

发布

注册 | 登录

下一场革命：Vibe Engineering｜OpenAI 内部分享

赛博禅心

2025-12-17

0 评论 159 浏览 0 收藏

8 分钟

OpenAI 内部掀起 Vibe Engineering 革命，区别于盲目依赖 AI 生成代码的 Vibe Coding，Codex 采用率超 92%，助力工程师 PR 产出提升 70%。12 小时从零重写项目、7 小时 200 轮迭代验证 500 行有效代码，AI 让代码变廉价，而信任与人类判断力成为核心价值。

OpenAI 办了一场内部分享，主题是 Vibe Engineering，这里区别于「Vibe Coding」，具体为啥，容我细细道来

Developer Experience 负责人 Romain Huet 和工程师 Aaron Friel 讲了一个数据：

OpenAI 内部技术人员的 Codex 采用率超过 92%，所有内部 PR 都由 Codex 审核，使用 Codex 的工程师产出的合并 PR 比不用的多 70%

发生在 OpenAI 内部的革命

Friel 也讲的另一个故事：

让 Codex 跑了 7 小时，迭代了 200 多轮测试，最终产出的 diff 只有大约 500 行

代码行数越来越便宜了，但证明代码有效这件事，变贵了

代码越来越便宜，信任越来越贵

12 小时，从空目录到完整项目

分享会上， Friel 做了个现场演示把一个叫 Bazel Diff 的 Kotlin 项目用 Rust 从零重写，要求 100% 兼容原项目

12 小时，从空目录到完整项目

起点是一个空目录，里面只有一个 prompt 文件Friel 把 prompt 贴进 Codex CLI，然后就….等着

Codex 做的第一件事不是写代码，是创建一个「watchdog」子代理——专门用来提醒主代理「你的目标是什么、用户的要求是什么」，防止跑偏

然后它启动了一堆子代理并行工作，有的用 GPT 5.1，有的用 Codex Mini，分别去研究上游项目的代码、调研 Bazel 8 和 Bazel 9 的差异、设计项目架构

所有进度都记录在一个叫「exec plan」的文件里——不只是给模型看的，也是给人看的

Friel 说他之前晚上跑过一次完整的，大概 12 小时跑完这个任务如果让工程师手写，大概需要几周

7 小时 500 行的故事

这是 Friel 在 Dev Day 讲过的故事，现在有了更多细节当时他在沙发上边看电视边干活，顺手把电脑设成不休眠，让 Codex 跑一个任务第二天早上醒来发现 Codex 还在跑

7 小时，200 多轮迭代，最终产出一个大约 500 行的 diff

7小时，200轮迭代，500行代码

Friel 说很多工程师听到这个数字的第一反应是：「完了，写了 10 万行垃圾代码吧？」

但事实相反——这是一个非常复杂的改动，Codex 把大部分时间花在了跑测试、改测试、再跑测试上

最终这个改动被 merge 了

Romain 说这才是新的进度单位：更少的错误、更好的 review、更高的置信度——即使最终的 patch 很小

Codex 的自我构建

一个细节：OpenAI 用 Codex 来开发 Codex

系统开始自我优化

Romain 说这就是为什么 Codex 几乎每隔几天就能发一个新版本

recursive self-improvement，从 Codex 开始

非工程师也在用

OpenAI 内部，有一个 Codex 的 Slack 集成，非技术团队可以直接问 Codex 关于代码库的问题

比如产品经理想知道某个功能是怎么实现的，销售想了解某个 API 的细节，不用再去找工程师约会议了

技术，流向每一个人

Friel 说：Codex 回答这些问题有时候比他自己回答得还好

设计师也在用，比如通过 MCP 连接 Figma，直接把 Figma 组件拉成代码

Romain 的说法是：不是每个人都要变成工程师，但每个人都在变得更技术

所有工程师都升职了

Friel 开玩笑说：现在所有工程师都变成 Manager 了

因为你不再是自己写代码，而是给 Codex 分配任务、审核它的产出

而且 Codex 还会自己创建子代理、给子代理分配任务

所以准确说，大家都变成 Director 了

所有人都升职了

Best of N

Codex 有一个功能叫「Best of N」你给它一个任务，它可以并行尝试 4 种不同的方案，然后把 4 个结果的截图都给你看

并行探索

Friel 说他经常用这个功能——先看 4 个方案，挑一个最顺眼的，然后继续迭代

Romain 的说法是：这就是创意流动的方式，让 AI 想 4 个方案供你挑选

什么变重要了

关于这些工具带来的能力瓶颈转移，Romain 讲得很直接：

设计和品味（taste）
判断力（discernment）
清晰的沟通

还有一个：产出让人类愿意读的东西

「重要」的迁移

Friel 说他有一个测试标准如果 Codex 的产出是你自己不想读的东西，那它对 AI 代理也不会有用

他们在推动工程师多写文档、多写测试的理由也是这个：这些东西，不只是给人看的，也是给下一个接手这个代码库的 AI 代理看的

话说回来

Simon Willison 提出「Vibe Engineering」这个词是为了跟「Vibe Coding」区分开

Vibe Coding 是让模型随便写代码然后祈祷测试能过Vibe Engineering 是高级工程师对每一行代码负责，但在规划、架构、调试、文档各个环节都用上代理

要用 AI 构建，也要保持人类的责任

本文由人人都是产品经理作者【赛博禅心】，微信公众号：【赛博禅心】，原创/授权发布于人人都是产品经理，未经许可，禁止转载。

题图来自Unsplash，基于 CC0 协议。

更多精彩内容，请关注人人都是产品经理微信公众号或下载App

赛博禅心

拜AI古佛，修赛博禅心

59篇作品 182040总阅读量

产品周报239期 | 抖音电商测试PC端购物与种草带货，爱奇艺恢复会员高清投屏登录设备规则

02-244629 浏览

产品周报239期 | 抖音电商测试PC端购物与种草带货，爱奇艺恢复会员高清投屏登录设备规则

支付宝决定「抖音化」，可行吗？

05-096156 浏览

支付宝决定「抖音化」，可行吗？

受短剧刺激，短视频也要付费，用户是否买单？

11-244868 浏览

受短剧刺激，短视频也要付费，用户是否买单？

回县城能赚钱的10个生意

10-085098 浏览

回县城能赚钱的10个生意

让招聘变得越来越「简单」，是个错误的方向！

03-049363 浏览

让招聘变得越来越「简单」，是个错误的方向！

评论

目前还没评论，等你发挥！

越贵的产品，越依赖内容去成交

11-187200 浏览
华为供应链体系 | 供应链管理：ISC流程体系详解

02-0818290 浏览
抖音“外卖”怎么样？我们体验了一把

02-099763 浏览