《置身钉内》刷屏之后:为什么越勤奋的 AI 团队,做出来的产品越没人要?
从钉钉 ONE 的复盘里,我抠出了 AI 产品「越冲刺越割裂」的 7 个病灶,以及对应的组织解法。一句话剧透:战术上的勤奋,正在系统性地掩盖战略上的懒惰。

最近,一篇叫《置身钉内》的长文在产品圈悄悄流传。
它的作者是钉钉旗舰级 AI 原生产品「ONE」从立项到收缩、待到最后并亲手送走它的那个产品经理。7.5 万字,夹叙夹议,没有一句正确的废话,全是现场的犹豫、补丁、争论和失落。标题本身就是个一语双关的好钩子——”置身事内”的”事”,换成了钉钉的”钉”。
我做 AI 产品,读完这篇坐了很久。因为它精准地戳中了一件让无数 AI 团队夜不能寐的事:
为什么我们从来不缺勤奋,却总是离真实用户越来越远?
每个月都在冲刺、作战,日清日结,007 连轴转——可做出来的 AI 产品,要么是替用户臆想出来的伪需求,要么是发布会上很酷、用户手里没人点的”未来感入口”。
作者用了一个特别精确的词,这是一种**「过度努力」**:问题不在于没人响应,而在于响应得太快,快到来不及分辨这个问题来自哪里、指向哪里、解决之后是否真的让产品更接近用户。
说白了——用战术上的勤奋,掩盖战略上的懒惰。
这不是钉钉一家的病,而是 2025—2026 这一整代「AI 原生」产品的集体困境。
本文分三部分:先拆解割裂从何而来(7 个病灶),再谈 AI native 产品到底该怎么搞,最后落到大家最关心的组织形态。案例我尽量放到全球,因为这是一场所有玩家都在打的同构战争。
建议对照自查。如果你中了三条以上,你的团队大概率也”置身钉内”了。
一、为什么 AI 产品和真实需求如此割裂?7 个病灶
病灶 1:可见性陷阱——组织在用「记账法」代替「价值判断」
《置身钉内》里最锋利的一个概念,叫**「每日一包」**:老板上午在群里提的要求,晚上必须打进验收包;今天改交互,今天出稿,今天进包,今天验收。
听起来很爽。但作者后来想明白:「每日一包」本质上不是研发节奏,而是一套组织记账法。
能在当天进包的,算进展;能截图汇报的,算进展;能让老板晚上验收的,算进展;能写进 changelog 的,也算进展。
而另一类东西很难”入账”:用户个性化、消息排序的反馈闭环、长期记忆、权限、审计、失败恢复……它们不是不重要,只是不容易在当天显影。
于是项目看上去一直在跑,账面上每天都有收入,底下却不断形成隐债。
这就是割裂的第一性原因:组织奖励「可见性」,而 AI 的真正价值大多「不可见」。
人类学家詹姆斯·斯科特在《国家的视角》里讲过:权力天然偏爱它能看清、能测量、能管理的东西,哪怕那些不是最有价值的。它会把信息量极大的自然森林,改造成排列整齐、便于计数的人工林——几十年后地力耗尽。
AI 产品团队,正在大规模地种”人工林”:
- 做一张能截图的新卡片 → 可入账;让系统逐渐学会“对我来说什么重要” → 难入账。
- 改文案、补预览 → 当天可验收;建一套关系理解和责任归属模型 → 半年后才见效。
当全部考核、汇报、绩效都建立在“今天能不能看见变化”之上,理性的个体一定会系统性地逃离那些真正重要却不可见的工作。 这不是某个人懒,是机制本身的偏好。
战术勤奋之所以能掩盖战略懒惰,是因为前者”可入账”、后者”不可入账”。你的账本坏了,再多冲刺,都只是在错误的账本上滚动。
病灶 2:决策者看到的产品,根本不是用户看到的产品
这条,可能是 to B / 企业级 AI 产品最致命的一个,也直接解释了”臆想替用户决策”。
《置身钉内》把钉钉 CEO 无招本人,当作一种特殊”用户”来做定性研究,结论是:他是一个极端用户,而极端用户的痛点不能当成全体用户的路径。大家都争抢着做所谓的“老板需求”。
为什么?作者给了一个我读到拍案的判断:
AI 的一大价值,是把奢侈品级别的服务下放给普通人。而越是已经享受了“人肉个性化服务”的人,越意识不到普通用户为什么需要它。
老板、核心客户、关键人物,身边天然有人替他筛信息、排优先级、记偏好——他们早就被”人工个性化”包围了。所以当 AI 系统”不够懂他”时,对他不构成强痛点。他看到的产品,从来不是标准用户看到的产品。
这就是硅谷说烂了的 HiPPO 问题(Highest Paid Person’s Opinion,最高薪者的意见)。全球的企业级 AI 产品反复栽在这:产品是为”买单的人”(老板、采购)做的,但”使用的人”(一线员工)才是沉默的大多数。付钱的、使用的、受影响的,常常根本不是同一群人。
文章里有个被否决的案例特别典型:有同事去碧桂园共创,客户想用 ONE 给保安、保洁动态排活——巡逻、清洁、拍照,做完 check 一张卡片。这 case 极其成立,因为任务标准、链路明确的执行者,最愿意接受卡片式主动安排。但无招的判断是:ONE 要服务老板和高净值人群,不服务保安保洁。
由此作者提炼出一条反直觉的规律,值得每个 AI 产品经理记住:
越是主动、越有思考的工作者,越需要保留对自己工作顺序的掌控;反而是任务标准、链路明确的人,更可能接受 AI 的强安排。
而且,计划外的用户群体,往往比计划内的更诚实——因为他们不是被产品叙事召唤来的,是被具体价值吸引来的。一个设计在目标用户那不成立、却在另一群人那成立,不是偏题,是产品机会在提示你:它真正的归宿,不在你想象的地方。
病灶 3:发心贪心——什么都想要,结果什么都得不到
ONE 从第一天起就背着四重发心:帮用户减负、给钉钉一个 AI 新入口、给无招回归一场聚人心的战役、消化 token 做商业化。
作者一针见血:“当一个产品的发心又多又没有主次的时候,就会成为一个贪心而焦虑的产品。”
这就是为什么大量 AI 产品做成了”四不像”:既想做所有人的入口(广),又想解决能付费的深问题(深);既要 DAU,又要商业化,还要扛”我们是未来”的叙事。结果卡在中间——做广,只能抓不够痛的通用痛点;做深,就变成客户定制,失去全局入口的意义。
全球最经典的反面教材是西南航空。连续 45 年盈利,靠的全是“不做什么”:只用波音 737、只做点对点不做中转、不分舱位、不供正餐。其他航司不是不想学,而是舍不得做减法——一边推廉航子品牌(美航快线、联合的 Ted、达美的 Song),一边死守复杂机队和舱位,最后子品牌全军覆没。
真正的战略优势,不来自你做了什么,而来自你敢于不做什么。
这句话对 AI 尤其残酷,因为 AI 时代什么都”看起来能做”,诱惑空前。今天 Slack 讲 agentic OS,明天 Salesforce 讲 Agentforce,后天创业公司说十个人的活一个 Agent 全干了。所有人都在喊”再不快就被甩下车”,于是把所有”看似好”的能力都塞进一个入口,最终面面俱到,面面平庸。
病灶 4:刷分思维——把真实世界,改造成适合考试的题目
钉钉内部提过「90 分 Agent」。本意没错:Agent 不能只在 demo 里聪明,要在真实业务里交付。
但作者点破了陷阱:90 分,究竟评的是什么?
如果评的是短期交付效果,团队就会本能地收窄场景、减少变量、提高命中率。文章里的例子是”已读未回”提醒——为提升成功率,最后只监听直属上级的消息。关系清楚、规则明确、模型好判断、指标好看。
可用户价值也随之变窄了。一个人真正容易忘的,恰恰是客户群里没人接的一句话、同事随口托付的小事、会后没落地的后续——这些更散、更脏、更难归因,却更接近真实工作。
一个高分小题,未必是一个好产品。这就是削足适履最隐蔽的地方:它看起来在追求交付,实际是在把用户的脚,修成鞋的形状。
模型公司刷 benchmark,产品公司刷 demo,全球同此凉热。但 Salesforce 2025 年的 SCUBA benchmark 给所有人泼了冷水:真实 CRM 工作流的 computer-use 任务,零样本下开源模型 Agent 成功率不足 5%,闭源最高也只有 39%。真实世界从不干净:信息散在不同系统,责任藏在人际关系,流程有例外,权限有边界,用户还有情绪。
病灶 5:把「未来」当成逃避「现在」的方式——技术债 = 概念债
作者引了 fast.ai 那篇《Build to Last》,记录 Chris Lattner(LLVM、Swift、Mojo 之父)的判断:真正留得下来的软件,靠的不是短期堆砌,而是第一性原理、架构质量和手艺。LLVM 能撑二十多年,不是追过每个风口,而是一开始就从根本问题搭了地基。
放到 AI 产品上就是那句刺耳良言:
快分两种。一种快,是因为地基打得好、抽象做得好,所以越做越顺;另一种快,是今天补一个口子,明天糊一个入口,后天把老板刚提的问题塞进包里。前一种快是能力,后一种快是欠债。
AI 产品的技术债,远不只代码债。它还包括:没理解用户关系,却让模型判断重要性;没建反馈闭环,却要求系统越来越懂用户;没打通权限审计,却想跨系统执行;没 dogfooding 到足够痛,却急着对外说它是工作入口。
这些债一开始都很安静,不会像 bug 立刻报错。直到某天用户说”不智能”,团队说”我们明明做了很多”——然后,债到期了。
Lattner 最狠的一句是:因为相信明天有更大的模型,今天就不打地基;因为觉得后天 Agent 自动解决一切,今天就不认真理解用户和系统——这不是拥抱未来,是拿未来替现在逃债。
病灶 6:替用户决策的傲慢——以为越主动,就是越智能
ONE 的核心理念是”主动服务””让事找人”。但作者反思,这套理念的底层”非常傲慢”:我们希望一上来就猜准用户想要什么,然后推荐。
最典型的灾难是「已读恐怖主义」。
ONE 把消息做成 AI 秘书呈上来的卡片,用户一旦在卡片里刷到,就直接被算”已读”。可真实工作里,不立刻点开消息,不是怠惰拖延,而是给自己留一点处理的余地——比如想等一小时后开完会有结论,再一次性回复。
ONE 的卡片把这点余地压没了。它本想替用户减少读信压力,实际却提前启动了责任压力。作者的总结字字见血:
剥夺了用户的选择权,责任和后果却要用户承担。这委屈谁受得了?
这是全球 AI 产品共同的傲慢。我们太迷恋”主动””智能””替你决策”,忘了对一个有判断力的工作者,AI 最大的价值是放大他的 agency,而不是替代他的 agency。
一条铁律:用户需求分布越分散,越说明他们要的不是”又一个统一硬规则”,而是”系统逐渐学会我是谁”。
病灶 7:共创幻觉——内测玩家,不是正式服玩家
最后一个,关于用户研究本身的失真。
钉钉有很强的”共创”文化,本是好事。但作者点破暗面:共创用户不等于真实用户,共创现场不等于真实现场。
共创用户愿意给时间、能理解产品不成熟,也更容易被你的叙事、演示和陪伴影响;尤其当他”有求于”你时,评判会变得更委婉、更愿意替你补全意义。
共创用户见过产品经理,普通用户只见到入口。共创用户知道你想做什么,普通用户只关心这东西有没有在三秒内帮到他。
文章用网易《射雕》打了个绝佳类比:重金买金庸版权的 MMO,内测精选玩家、密集发福利,用”人”补上了真实玩家和真实游戏的 gap,内部评级 A/S。结果正式上线真实玩家不继承这些上下文,数据惨淡,一年半停运。
这正是《The Mom Test》反复强调的:别问“你觉得我的想法好不好”,大多数人会出于礼貌给你好听但无用的答案。 要问过去的事实、具体的行为、真实的成本。
用户最诚实的答案,往往不在嘴上,而在成本里。 一句”挺好的”也许只是礼貌;一个没夸几句、却愿意把工作流交给你的用户,才是更重的信号。
二、AI Native 产品到底该怎么搞?4 条正解
诊断完病灶,来谈正面方案。
1. 锚定一个真正的发心:AI 是「奢侈服务的平民化」
整篇《置身钉内》给 AI 产品最大的方法论馈赠,是这句:
AI 的核心价值,是把过去只有少数人享受得起的贴身服务,变成每个普通工作者都能拥有的日常。
奢华酒店记得客人偏好——爱吃什么水果、枕头多高、上次住哪间;普通酒店做不到,不是不想,是成本不允许。AI 第一次让”记住你、懂你、为你定制”的边际成本趋近于零。
这才是 AI native 该死磕的发心:不是把老板级体验再送给老板(价值很小),而是把贴身服务下放给每一个沉默的普通人。
落到产品,就是去投资那些”难入账”的地基:记忆、偏好、反馈闭环、长期个性化,让系统逐渐学会”对我来说什么重要”。这恰恰是被「每日一包」反复挤掉的东西,也是 AI native 与”旧产品+聊天框”的根本分水岭。
全球做对的玩家都在这条路上:Claude 做 memory 和 projects、ChatGPT 做 memory 和 custom instructions、Notion AI 把 AI 织进你自己的知识结构——它们都在解决”系统如何逐渐成为你的延伸”,而不是”如何更主动地替你决策”。
2. 放大 agency,而不是替代 agency
判断一个 AI 交互设计的好坏,问三个问题:
- 它保留了用户的选择余地,还是剥夺了?(已读问题的教训)
- 它让用户更理解正在发生什么,还是把判断藏进黑盒?(排序被卡片遮住的教训)
- 出错以后,有没有后路?(失败兜底、可撤销、可关闭)
与其用一个个酷炫的强规则去 cater 少数 KP,不如做一个逐渐学会”我是谁”、可被用户自己塑造的入口。
3. 战略即放弃:先想清楚「先做什么」,而不是「想做什么」
发心是”I have a dream”,发散、抒情;定位是”先做什么”,收敛、残忍。作者的比喻很妙:发心是选柴,定位是捆柴的绳——柴选得好只说明有得烧,捆不好,设计进来就到处点火,风一吹就散。
三条”放弃”纪律:
- 一个主发心。 一句话说不清”为谁、在哪用、解决什么、凭什么是你”,就还没资格进开发。
- 一类种子用户,做到极痛。 学西南航空,宁可放弃九成”看似好”的场景,把一类用户的一个真问题做穿。
- 窄切口慢工打磨,而不是大入口快速铺开。 广积粮,缓称王。消息能不能处理、日程能不能闭环这些小仗没赢,Agent OS 就只能飘在空中。
4. Build to Last:地基先行,分清「赶路」与「探索」
AI 时代当然要快,但要分清哪段该省、哪段该投:
- 能快的地方往死里快:原型、验证、反馈、低风险试错。
- 该慢的地方别假装快:用户心智、系统架构、权限模型、业务穿透。一味求快,后面要用返工、解释、客服、信任来还债。
作者用爱马仕丝巾打比方:一条丝巾要两年,不是流水线躺两年,而是图案要拆成几十个颜色层,每层一次工艺判断。它慢不是低效,而是价值本就包含审美、材料理解和反复校准——时间被收进了作品里。
但别误会:说不清“在换什么”的慢,是拖延;说得清换更准的判断、更稳的地基、更少的返工、更可复用的能力的慢,才是长期投资。 还有一条:有明确目标的“赶路型”开发,和没明确目标的“探索创新型”开发,底层完全不同。 把探索当赶路来管(一周做完、一个月超越竞对),是 AI 组织最常见的失能。
三、对应的组织形态:流水线,管不了创造性劳动
产品方案再好,落不进组织也是空谈。而这,恰恰是”类钉钉”组织最该照镜子的地方。
核心命题:你是西点军校,还是雅典学院?
《置身钉内》提出了一个可以裱起来的二分:
钉钉是一座西点军校。西点训练服从和纪律,适合打仗,适合明确目标下的执行。秦始皇用 40 字诏书一刀切统一度量衡——这种规范少量专家拍板就好。
与之相反的是雅典学院:容纳争论、游荡和奇想。它未必高效,却适合产生复杂判断。早期 OpenAI、Google DeepMind 就属于这种。
随后是那句略带黑色幽默却极深刻的判断:
生产者在怎样的环境中产出,就会在产品里植入什么样的基因。残酷的养鸡场,养不出健康快乐好吃的白羽鸡。用流水线逻辑管理创造性劳动,产品也会带上流水线的气味:能动能响,能给进度,却缺乏灵气和温度。
这就是病根:”战术勤奋掩盖战略懒惰”的组织,本质是用西点军校的范式(服从、纪律、可见投入、日清日结),去管理一件需要雅典学院范式(复杂判断、灵感、试错、自驱)的事。范式错配,再勤奋也是奔波。
五条处方,案例放到全球。
处方 1:把「敏捷」从「证明」切回「学习」
作者对”敏捷”最深的警惕,值得抄在墙上:
真正的敏捷,不是每天都有东西改,不是老板一问团队就答,不是一个问题 24 小时内必须交付,也不是把所有长期问题拆成短期补丁。
真正的敏捷,是更快学习、更快校准、更快承认误差、更快把资源转向正确问题。如果一个团队每天都在动,却没有更接近正确问题,那不叫敏捷,叫奔波。
落地动作:重新定义「胜仗」。 用户真用起来是胜仗,数据长出来是胜仗,难题被解决是胜仗,团队比昨天更接近正确方向也是胜仗。产品人和工程师不怕辛苦,怕的是累了很久,却不知道自己赢在哪里——没有胜仗的敏捷,很快变成消耗。
处方 2:修好「记账法」,让长期价值能入账
这是对病灶 1 的根治。既然组织系统性地逃离”不可见”的工作,那就改造度量系统:
- 考核从“交付了什么功能”(output)转向“用户行为发生了什么改变”(outcome):愿不愿意多点一次、改不改习惯、让不让团队用、把不把真实流程交出来。
- 为“地基型工作”单设账本和里程碑,不让它在每日验收里被紧急任务永远盖过。
- 警惕「文牍先行」:当 changelog、竞品走查、问题清单比产品本身更像产品时,团队就在为”可汇报”生产,而不是为”可沉淀”生产。脚手架搭久了,人会误以为楼已经建好了。
全球参照是 DeepSeek:不加班、不打卡、没有明确绩效考核,多数人 6—7 点下班。梁文锋的判断朴素得像常识——一个人每天高质量工作很难超过 6—8 小时,加班疲劳下的昏庸判断反而浪费宝贵算力。但在很多组织里,这种常识异常稀缺。
处方 3:小而完整的自治团队——学 Skunk Works 的「骨」,别只学「皮」
大组织做 AI 创新,爱成立保密”特区”。但作者警告:秘密项目最怕学到皮,没学到骨。
洛克希德 Skunk Works(U-2、SR-71、F-117)的关键不只是保密,而是**「小而完整」:目标清楚、授权集中、团队能内部快速闭环、对母体依赖压到最低**。它像一把短刀,握在一个人手里,所以快。
只学到”关门”,没学到”小团队闭环”;只学到”少数人知道”,没学到”少数人就能把事做完”——结果门关上了,接口还在外面,一个小需求对三遍、拉很多人,信息层层损耗成猜谜。
事以密成,前提是密处能成。密处不能自足,秘密就从保护机制变成信损机制。
处方 4:保密的边界,画在「组织与外部」之间,而不是团队内部
作者用 Anthropic 做参照:对外很谨慎,很多东西不轻易说;但对内保留极强的讨论和挑战空间——鼓励员工在 Slack 上直接挑战 CEO,内部有开放的长文讨论;同时对外用模型卡、安全政策、透明度页面选择性披露。
一条清晰原则:
外部可以保密,内部要保共识。外部不能让对手看见粮道,内部不能让同袍只拿到一段断简残编。
当保密一层层画进队伍内部,越靠近中心越知道”为什么”,越在外围越只知道”做什么”。中心变强、理解变窄,项目看着更快,其实更依赖少数人的解释权——而这只在掌握核心解释权的人能力极强时才成立。秦始皇可以,秦二世不行。 把全公司的产品判断力押在一个人的直觉上,是巨大的组织风险。
处方 5:把人当目的,而不是手段——可持续是创造力的前提
这条看似价值观,其实是最硬的生产力问题。
作者在 ONE 期间晕倒过两次,第二次被救护车送进急诊,诊断是过劳和密闭环境导致的呼吸性碱中毒。她写下一句话,我读到久久不能平静:
学徒不是柴火。柴火烧完就算,学徒要长手艺。一个人如果在一段工作里只被燃烧,没有长出判断、技艺、眼界和更稳定的内心,这段燃烧就要重新估价。
为什么这是生产力问题?因为创造性劳动和流水线劳动的反馈机制截然不同:流水线靠工时堆产出;创造性劳动依赖灵感、判断和顿悟——庞加莱搞定富克斯函数的关键一步,恰恰发生在他放下工作、踏上郊游马车的那一刻。一个把身体、注意力、尊严当作随取随用材料的组织,养不出复杂判断,只能养出疲惫和应付。
一个组织如何回答”人是目的还是手段”,不在口号里,在这些小动作里:项目室怎么安排,休息怎么评价,请假怎么打分,竞对压力怎么传导。
结语:看得远,更要打得对
钉钉其实没看错终局——企业 AI 的核心,确实是组织上下文、工作流、权限、入口和执行闭环;它手里也确实握着 IM、组织架构、审批、日程、会议、表格、低代码、阿里云和通义模型,一手好牌。
它的问题,用作者的话说,是**「太早用终局叙事,组织中局战斗」**。看得远,却打得急;太想一次性宣布自己就是未来。
回到最初的困惑:为什么生产 AI 产品的公司,和真正的用户需求如此割裂?
我的回答是:因为大多数组织把「勤奋」误当成「战略」,把「可见的变化」误当成「真实的价值」,把「决策者的兴奋点」误当成「用户的需求」,把「流水线的纪律」误当成「创造的土壤」。
这四重误置叠加,就让一群最聪明、最努力的人,日复一日、高速地,奔向一个错误的方向。
破局其实不复杂,难的是知行合一:
看见远方以后,仍然有耐心先修脚下的路。
——”军争之难者,以迂为直,以患为利。”这,才是真章。
快,就是慢;慢,就是快。
作者注:本文基于一线复盘长文《置身钉内》的洞察展开,结合全球 AI 产品与组织实践做延伸分析与框架重构。文中引述的具体案例与原作判断,版权归原作者所有。
专栏作家
大仙河,公众号:大仙河知识学堂,人人都是产品经理专栏作家。7年AI产品相关经验,专注AI产品化(元宇宙、数字人、全息通信等)领域,致力于构建人工智能学术和工业界的桥梁。
本文原创发布于人人都是产品经理,未经许可,禁止转载。
题图来自Unsplash,基于CC0协议

起点课堂会员权益





如果老板和一线用户的利益天然冲突,有没有办法让考核机制同时兼顾买单者和使用者?还是说只能选一头?
把奢侈服务平民化这个发心确实抓到了AI的本质,但落地还需要组织愿意为不可见的价值买单,比如长期记忆和反馈闭环。
每日一包这个比喻很精准,但问题是很多团队也知道这样不对,却找不到更好的考核方式。毕竟老板要看到进展,不能半年后才给结果。
先点出战术勤奋掩盖战略懒惰的核心矛盾,再拆解七个病灶比如每日一包和HiPPO问题,最后落到组织需要从西点军校转向雅典学院。读完感觉很多AI团队都在按错误账本赶路。