《置身钉内》刷屏之后:为什么越勤奋的 AI 团队,做出来的产品越没人要?

4 评论 449 浏览 4 收藏 32 分钟

从钉钉 ONE 的复盘里,我抠出了 AI 产品「越冲刺越割裂」的 7 个病灶,以及对应的组织解法。一句话剧透:战术上的勤奋,正在系统性地掩盖战略上的懒惰。

最近,一篇叫《置身钉内》的长文在产品圈悄悄流传。

它的作者是钉钉旗舰级 AI 原生产品「ONE」从立项到收缩、待到最后并亲手送走它的那个产品经理。7.5 万字,夹叙夹议,没有一句正确的废话,全是现场的犹豫、补丁、争论和失落。标题本身就是个一语双关的好钩子——”置身事内”的”事”,换成了钉钉的”钉”。

我做 AI 产品,读完这篇坐了很久。因为它精准地戳中了一件让无数 AI 团队夜不能寐的事:

为什么我们从来不缺勤奋,却总是离真实用户越来越远?

每个月都在冲刺、作战,日清日结,007 连轴转——可做出来的 AI 产品,要么是替用户臆想出来的伪需求,要么是发布会上很酷、用户手里没人点的”未来感入口”。

作者用了一个特别精确的词,这是一种**「过度努力」**:问题不在于没人响应,而在于响应得太快,快到来不及分辨这个问题来自哪里、指向哪里、解决之后是否真的让产品更接近用户。

说白了——用战术上的勤奋,掩盖战略上的懒惰。

这不是钉钉一家的病,而是 2025—2026 这一整代「AI 原生」产品的集体困境。

本文分三部分:先拆解割裂从何而来(7 个病灶),再谈 AI native 产品到底该怎么搞,最后落到大家最关心的组织形态。案例我尽量放到全球,因为这是一场所有玩家都在打的同构战争。

建议对照自查。如果你中了三条以上,你的团队大概率也”置身钉内”了。

一、为什么 AI 产品和真实需求如此割裂?7 个病灶

病灶 1:可见性陷阱——组织在用「记账法」代替「价值判断」

《置身钉内》里最锋利的一个概念,叫**「每日一包」**:老板上午在群里提的要求,晚上必须打进验收包;今天改交互,今天出稿,今天进包,今天验收。

听起来很爽。但作者后来想明白:「每日一包」本质上不是研发节奏,而是一套组织记账法。

能在当天进包的,算进展;能截图汇报的,算进展;能让老板晚上验收的,算进展;能写进 changelog 的,也算进展。

而另一类东西很难”入账”:用户个性化、消息排序的反馈闭环、长期记忆、权限、审计、失败恢复……它们不是不重要,只是不容易在当天显影

于是项目看上去一直在跑,账面上每天都有收入,底下却不断形成隐债。

这就是割裂的第一性原因:组织奖励「可见性」,而 AI 的真正价值大多「不可见」。

人类学家詹姆斯·斯科特在《国家的视角》里讲过:权力天然偏爱它能看清、能测量、能管理的东西,哪怕那些不是最有价值的。它会把信息量极大的自然森林,改造成排列整齐、便于计数的人工林——几十年后地力耗尽。

AI 产品团队,正在大规模地种”人工林”:

  • 做一张能截图的新卡片 → 可入账;让系统逐渐学会“对我来说什么重要” → 难入账。
  • 改文案、补预览 → 当天可验收;建一套关系理解和责任归属模型 → 半年后才见效。

当全部考核、汇报、绩效都建立在“今天能不能看见变化”之上,理性的个体一定会系统性地逃离那些真正重要却不可见的工作。 这不是某个人懒,是机制本身的偏好。

战术勤奋之所以能掩盖战略懒惰,是因为前者”可入账”、后者”不可入账”。你的账本坏了,再多冲刺,都只是在错误的账本上滚动。

病灶 2:决策者看到的产品,根本不是用户看到的产品

这条,可能是 to B / 企业级 AI 产品最致命的一个,也直接解释了”臆想替用户决策”。

《置身钉内》把钉钉 CEO 无招本人,当作一种特殊”用户”来做定性研究,结论是:他是一个极端用户,而极端用户的痛点不能当成全体用户的路径。大家都争抢着做所谓的“老板需求”。

为什么?作者给了一个我读到拍案的判断:

AI 的一大价值,是把奢侈品级别的服务下放给普通人。而越是已经享受了“人肉个性化服务”的人,越意识不到普通用户为什么需要它。

老板、核心客户、关键人物,身边天然有人替他筛信息、排优先级、记偏好——他们早就被”人工个性化”包围了。所以当 AI 系统”不够懂他”时,对他不构成强痛点。他看到的产品,从来不是标准用户看到的产品。

这就是硅谷说烂了的 HiPPO 问题(Highest Paid Person’s Opinion,最高薪者的意见)。全球的企业级 AI 产品反复栽在这:产品是为”买单的人”(老板、采购)做的,但”使用的人”(一线员工)才是沉默的大多数。付钱的、使用的、受影响的,常常根本不是同一群人。

文章里有个被否决的案例特别典型:有同事去碧桂园共创,客户想用 ONE 给保安、保洁动态排活——巡逻、清洁、拍照,做完 check 一张卡片。这 case 极其成立,因为任务标准、链路明确的执行者,最愿意接受卡片式主动安排。但无招的判断是:ONE 要服务老板和高净值人群,不服务保安保洁。

由此作者提炼出一条反直觉的规律,值得每个 AI 产品经理记住:

越是主动、越有思考的工作者,越需要保留对自己工作顺序的掌控;反而是任务标准、链路明确的人,更可能接受 AI 的强安排。

而且,计划外的用户群体,往往比计划内的更诚实——因为他们不是被产品叙事召唤来的,是被具体价值吸引来的。一个设计在目标用户那不成立、却在另一群人那成立,不是偏题,是产品机会在提示你:它真正的归宿,不在你想象的地方。

病灶 3:发心贪心——什么都想要,结果什么都得不到

ONE 从第一天起就背着四重发心:帮用户减负、给钉钉一个 AI 新入口、给无招回归一场聚人心的战役、消化 token 做商业化。

作者一针见血:“当一个产品的发心又多又没有主次的时候,就会成为一个贪心而焦虑的产品。”

这就是为什么大量 AI 产品做成了”四不像”:既想做所有人的入口(广),又想解决能付费的深问题(深);既要 DAU,又要商业化,还要扛”我们是未来”的叙事。结果卡在中间——做广,只能抓不够痛的通用痛点;做深,就变成客户定制,失去全局入口的意义。

全球最经典的反面教材是西南航空连续 45 年盈利,靠的全是“不做什么”:只用波音 737、只做点对点不做中转、不分舱位、不供正餐。其他航司不是不想学,而是舍不得做减法——一边推廉航子品牌(美航快线、联合的 Ted、达美的 Song),一边死守复杂机队和舱位,最后子品牌全军覆没。

真正的战略优势,不来自你做了什么,而来自你敢于不做什么。

这句话对 AI 尤其残酷,因为 AI 时代什么都”看起来能做”,诱惑空前。今天 Slack 讲 agentic OS,明天 Salesforce 讲 Agentforce,后天创业公司说十个人的活一个 Agent 全干了。所有人都在喊”再不快就被甩下车”,于是把所有”看似好”的能力都塞进一个入口,最终面面俱到,面面平庸。

病灶 4:刷分思维——把真实世界,改造成适合考试的题目

钉钉内部提过「90 分 Agent」。本意没错:Agent 不能只在 demo 里聪明,要在真实业务里交付。

但作者点破了陷阱:90 分,究竟评的是什么?

如果评的是短期交付效果,团队就会本能地收窄场景、减少变量、提高命中率。文章里的例子是”已读未回”提醒——为提升成功率,最后只监听直属上级的消息。关系清楚、规则明确、模型好判断、指标好看。

可用户价值也随之变窄了。一个人真正容易忘的,恰恰是客户群里没人接的一句话、同事随口托付的小事、会后没落地的后续——这些更散、更脏、更难归因,却更接近真实工作。

一个高分小题,未必是一个好产品。这就是削足适履最隐蔽的地方:它看起来在追求交付,实际是在把用户的脚,修成鞋的形状。

模型公司刷 benchmark,产品公司刷 demo,全球同此凉热。但 Salesforce 2025 年的 SCUBA benchmark 给所有人泼了冷水:真实 CRM 工作流的 computer-use 任务,零样本下开源模型 Agent 成功率不足 5%,闭源最高也只有 39%。真实世界从不干净:信息散在不同系统,责任藏在人际关系,流程有例外,权限有边界,用户还有情绪。

病灶 5:把「未来」当成逃避「现在」的方式——技术债 = 概念债

作者引了 fast.ai 那篇《Build to Last》,记录 Chris Lattner(LLVM、Swift、Mojo 之父)的判断:真正留得下来的软件,靠的不是短期堆砌,而是第一性原理、架构质量和手艺。LLVM 能撑二十多年,不是追过每个风口,而是一开始就从根本问题搭了地基。

放到 AI 产品上就是那句刺耳良言:

快分两种。一种快,是因为地基打得好、抽象做得好,所以越做越顺;另一种快,是今天补一个口子,明天糊一个入口,后天把老板刚提的问题塞进包里。前一种快是能力,后一种快是欠债。

AI 产品的技术债,远不只代码债。它还包括:没理解用户关系,却让模型判断重要性;没建反馈闭环,却要求系统越来越懂用户;没打通权限审计,却想跨系统执行;没 dogfooding 到足够痛,却急着对外说它是工作入口。

这些债一开始都很安静,不会像 bug 立刻报错。直到某天用户说”不智能”,团队说”我们明明做了很多”——然后,债到期了。

Lattner 最狠的一句是:因为相信明天有更大的模型,今天就不打地基;因为觉得后天 Agent 自动解决一切,今天就不认真理解用户和系统——这不是拥抱未来,是拿未来替现在逃债。

病灶 6:替用户决策的傲慢——以为越主动,就是越智能

ONE 的核心理念是”主动服务””让事找人”。但作者反思,这套理念的底层”非常傲慢”:我们希望一上来就猜准用户想要什么,然后推荐。

最典型的灾难是「已读恐怖主义」。

ONE 把消息做成 AI 秘书呈上来的卡片,用户一旦在卡片里刷到,就直接被算”已读”。可真实工作里,不立刻点开消息,不是怠惰拖延,而是给自己留一点处理的余地——比如想等一小时后开完会有结论,再一次性回复。

ONE 的卡片把这点余地压没了。它本想替用户减少读信压力,实际却提前启动了责任压力。作者的总结字字见血:

剥夺了用户的选择权,责任和后果却要用户承担。这委屈谁受得了?

这是全球 AI 产品共同的傲慢。我们太迷恋”主动””智能””替你决策”,忘了对一个有判断力的工作者,AI 最大的价值是放大他的 agency,而不是替代他的 agency。

一条铁律:用户需求分布越分散,越说明他们要的不是”又一个统一硬规则”,而是”系统逐渐学会我是谁”。

病灶 7:共创幻觉——内测玩家,不是正式服玩家

最后一个,关于用户研究本身的失真。

钉钉有很强的”共创”文化,本是好事。但作者点破暗面:共创用户不等于真实用户,共创现场不等于真实现场。

共创用户愿意给时间、能理解产品不成熟,也更容易被你的叙事、演示和陪伴影响;尤其当他”有求于”你时,评判会变得更委婉、更愿意替你补全意义。

共创用户见过产品经理,普通用户只见到入口。共创用户知道你想做什么,普通用户只关心这东西有没有在三秒内帮到他。

文章用网易《射雕》打了个绝佳类比:重金买金庸版权的 MMO,内测精选玩家、密集发福利,用”人”补上了真实玩家和真实游戏的 gap,内部评级 A/S。结果正式上线真实玩家不继承这些上下文,数据惨淡,一年半停运。

这正是《The Mom Test》反复强调的:别问“你觉得我的想法好不好”,大多数人会出于礼貌给你好听但无用的答案。 要问过去的事实、具体的行为、真实的成本。

用户最诚实的答案,往往不在嘴上,而在成本里。 一句”挺好的”也许只是礼貌;一个没夸几句、却愿意把工作流交给你的用户,才是更重的信号。

二、AI Native 产品到底该怎么搞?4 条正解

诊断完病灶,来谈正面方案。

1. 锚定一个真正的发心:AI 是「奢侈服务的平民化」

整篇《置身钉内》给 AI 产品最大的方法论馈赠,是这句:

AI 的核心价值,是把过去只有少数人享受得起的贴身服务,变成每个普通工作者都能拥有的日常。

奢华酒店记得客人偏好——爱吃什么水果、枕头多高、上次住哪间;普通酒店做不到,不是不想,是成本不允许。AI 第一次让”记住你、懂你、为你定制”的边际成本趋近于零。

这才是 AI native 该死磕的发心:不是把老板级体验再送给老板(价值很小),而是把贴身服务下放给每一个沉默的普通人。

落到产品,就是去投资那些”难入账”的地基:记忆、偏好、反馈闭环、长期个性化,让系统逐渐学会”对我来说什么重要”。这恰恰是被「每日一包」反复挤掉的东西,也是 AI native 与”旧产品+聊天框”的根本分水岭。

全球做对的玩家都在这条路上:Claude 做 memory 和 projects、ChatGPT 做 memory 和 custom instructions、Notion AI 把 AI 织进你自己的知识结构——它们都在解决”系统如何逐渐成为你的延伸”,而不是”如何更主动地替你决策”。

2. 放大 agency,而不是替代 agency

判断一个 AI 交互设计的好坏,问三个问题:

  1. 保留了用户的选择余地,还是剥夺了?(已读问题的教训)
  2. 它让用户更理解正在发生什么,还是把判断藏进黑盒?(排序被卡片遮住的教训)
  3. 出错以后,有没有后路?(失败兜底、可撤销、可关闭)

与其用一个个酷炫的强规则去 cater 少数 KP,不如做一个逐渐学会”我是谁”、可被用户自己塑造的入口。

3. 战略即放弃:先想清楚「先做什么」,而不是「想做什么」

发心是”I have a dream”,发散、抒情;定位是”先做什么”,收敛、残忍。作者的比喻很妙:发心是选柴,定位是捆柴的绳——柴选得好只说明有得烧,捆不好,设计进来就到处点火,风一吹就散。

三条”放弃”纪律:

  • 一个主发心。 一句话说不清”为谁、在哪用、解决什么、凭什么是你”,就还没资格进开发。
  • 一类种子用户,做到极痛。 学西南航空,宁可放弃九成”看似好”的场景,把一类用户的一个真问题做穿。
  • 窄切口慢工打磨,而不是大入口快速铺开。 广积粮,缓称王。消息能不能处理、日程能不能闭环这些小仗没赢,Agent OS 就只能飘在空中。

4. Build to Last:地基先行,分清「赶路」与「探索」

AI 时代当然要快,但要分清哪段该省、哪段该投

  • 能快的地方往死里快:原型、验证、反馈、低风险试错。
  • 该慢的地方别假装快:用户心智、系统架构、权限模型、业务穿透。一味求快,后面要用返工、解释、客服、信任来还债。

作者用爱马仕丝巾打比方:一条丝巾要两年,不是流水线躺两年,而是图案要拆成几十个颜色层,每层一次工艺判断。它慢不是低效,而是价值本就包含审美、材料理解和反复校准——时间被收进了作品里。

但别误会:说不清“在换什么”的慢,是拖延;说得清换更准的判断、更稳的地基、更少的返工、更可复用的能力的慢,才是长期投资。 还有一条:有明确目标的“赶路型”开发,和没明确目标的“探索创新型”开发,底层完全不同。 把探索当赶路来管(一周做完、一个月超越竞对),是 AI 组织最常见的失能。

三、对应的组织形态:流水线,管不了创造性劳动

产品方案再好,落不进组织也是空谈。而这,恰恰是”类钉钉”组织最该照镜子的地方。

核心命题:你是西点军校,还是雅典学院?

《置身钉内》提出了一个可以裱起来的二分:

钉钉是一座西点军校。西点训练服从和纪律,适合打仗,适合明确目标下的执行。秦始皇用 40 字诏书一刀切统一度量衡——这种规范少量专家拍板就好。

与之相反的是雅典学院:容纳争论、游荡和奇想。它未必高效,却适合产生复杂判断。早期 OpenAI、Google DeepMind 就属于这种。

随后是那句略带黑色幽默却极深刻的判断:

生产者在怎样的环境中产出,就会在产品里植入什么样的基因。残酷的养鸡场,养不出健康快乐好吃的白羽鸡。用流水线逻辑管理创造性劳动,产品也会带上流水线的气味:能动能响,能给进度,却缺乏灵气和温度。

这就是病根:”战术勤奋掩盖战略懒惰”的组织,本质是用西点军校的范式(服从、纪律、可见投入、日清日结),去管理一件需要雅典学院范式(复杂判断、灵感、试错、自驱)的事。范式错配,再勤奋也是奔波。

五条处方,案例放到全球。

处方 1:把「敏捷」从「证明」切回「学习」

作者对”敏捷”最深的警惕,值得抄在墙上:

真正的敏捷,不是每天都有东西改,不是老板一问团队就答,不是一个问题 24 小时内必须交付,也不是把所有长期问题拆成短期补丁。

真正的敏捷,是更快学习、更快校准、更快承认误差、更快把资源转向正确问题。如果一个团队每天都在动,却没有更接近正确问题,那不叫敏捷,叫奔波。

落地动作:重新定义「胜仗」。 用户真用起来是胜仗,数据长出来是胜仗,难题被解决是胜仗,团队比昨天更接近正确方向也是胜仗。产品人和工程师不怕辛苦,怕的是累了很久,却不知道自己赢在哪里——没有胜仗的敏捷,很快变成消耗。

处方 2:修好「记账法」,让长期价值能入账

这是对病灶 1 的根治。既然组织系统性地逃离”不可见”的工作,那就改造度量系统

  • 考核从“交付了什么功能”(output)转向“用户行为发生了什么改变”(outcome):愿不愿意多点一次、改不改习惯、让不让团队用、把不把真实流程交出来。
  • 为“地基型工作”单设账本和里程碑,不让它在每日验收里被紧急任务永远盖过。
  • 警惕「文牍先行」:当 changelog、竞品走查、问题清单比产品本身更像产品时,团队就在为”可汇报”生产,而不是为”可沉淀”生产。脚手架搭久了,人会误以为楼已经建好了。

全球参照是 DeepSeek:不加班、不打卡、没有明确绩效考核,多数人 6—7 点下班。梁文锋的判断朴素得像常识——一个人每天高质量工作很难超过 6—8 小时,加班疲劳下的昏庸判断反而浪费宝贵算力。但在很多组织里,这种常识异常稀缺。

处方 3:小而完整的自治团队——学 Skunk Works 的「骨」,别只学「皮」

大组织做 AI 创新,爱成立保密”特区”。但作者警告:秘密项目最怕学到皮,没学到骨。

洛克希德 Skunk Works(U-2、SR-71、F-117)的关键不只是保密,而是**「小而完整」:目标清楚、授权集中、团队能内部快速闭环、对母体依赖压到最低**。它像一把短刀,握在一个人手里,所以快。

只学到”关门”,没学到”小团队闭环”;只学到”少数人知道”,没学到”少数人就能把事做完”——结果门关上了,接口还在外面,一个小需求对三遍、拉很多人,信息层层损耗成猜谜。

事以密成,前提是密处能成。密处不能自足,秘密就从保护机制变成信损机制。

处方 4:保密的边界,画在「组织与外部」之间,而不是团队内部

作者用 Anthropic 做参照:对外很谨慎,很多东西不轻易说;但对内保留极强的讨论和挑战空间——鼓励员工在 Slack 上直接挑战 CEO,内部有开放的长文讨论;同时对外用模型卡、安全政策、透明度页面选择性披露。

一条清晰原则:

外部可以保密,内部要保共识。外部不能让对手看见粮道,内部不能让同袍只拿到一段断简残编。

当保密一层层画进队伍内部,越靠近中心越知道”为什么”,越在外围越只知道”做什么”。中心变强、理解变窄,项目看着更快,其实更依赖少数人的解释权——而这只在掌握核心解释权的人能力极强时才成立。秦始皇可以,秦二世不行。 把全公司的产品判断力押在一个人的直觉上,是巨大的组织风险。

处方 5:把人当目的,而不是手段——可持续是创造力的前提

这条看似价值观,其实是最硬的生产力问题。

作者在 ONE 期间晕倒过两次,第二次被救护车送进急诊,诊断是过劳和密闭环境导致的呼吸性碱中毒。她写下一句话,我读到久久不能平静:

学徒不是柴火。柴火烧完就算,学徒要长手艺。一个人如果在一段工作里只被燃烧,没有长出判断、技艺、眼界和更稳定的内心,这段燃烧就要重新估价。

为什么这是生产力问题?因为创造性劳动和流水线劳动的反馈机制截然不同:流水线靠工时堆产出;创造性劳动依赖灵感、判断和顿悟——庞加莱搞定富克斯函数的关键一步,恰恰发生在他放下工作、踏上郊游马车的那一刻。一个把身体、注意力、尊严当作随取随用材料的组织,养不出复杂判断,只能养出疲惫和应付。

一个组织如何回答”人是目的还是手段”,不在口号里,在这些小动作里:项目室怎么安排,休息怎么评价,请假怎么打分,竞对压力怎么传导。

结语:看得远,更要打得对

钉钉其实没看错终局——企业 AI 的核心,确实是组织上下文、工作流、权限、入口和执行闭环;它手里也确实握着 IM、组织架构、审批、日程、会议、表格、低代码、阿里云和通义模型,一手好牌。

它的问题,用作者的话说,是**「太早用终局叙事,组织中局战斗」**。看得远,却打得急;太想一次性宣布自己就是未来。

回到最初的困惑:为什么生产 AI 产品的公司,和真正的用户需求如此割裂?

我的回答是:因为大多数组织把「勤奋」误当成「战略」,把「可见的变化」误当成「真实的价值」,把「决策者的兴奋点」误当成「用户的需求」,把「流水线的纪律」误当成「创造的土壤」。

这四重误置叠加,就让一群最聪明、最努力的人,日复一日、高速地,奔向一个错误的方向。

破局其实不复杂,难的是知行合一:

看见远方以后,仍然有耐心先修脚下的路。

——”军争之难者,以迂为直,以患为利。”这,才是真章。

快,就是慢;慢,就是快。

作者注:本文基于一线复盘长文《置身钉内》的洞察展开,结合全球 AI 产品与组织实践做延伸分析与框架重构。文中引述的具体案例与原作判断,版权归原作者所有。

专栏作家

大仙河,公众号:大仙河知识学堂,人人都是产品经理专栏作家。7年AI产品相关经验,专注AI产品化(元宇宙、数字人、全息通信等)领域,致力于构建人工智能学术和工业界的桥梁。

本文原创发布于人人都是产品经理,未经许可,禁止转载。

题图来自Unsplash,基于CC0协议

更多精彩内容,请关注人人都是产品经理微信公众号或下载App
评论
评论请登录
  1. 如果老板和一线用户的利益天然冲突,有没有办法让考核机制同时兼顾买单者和使用者?还是说只能选一头?

    来自广东 回复
  2. 把奢侈服务平民化这个发心确实抓到了AI的本质,但落地还需要组织愿意为不可见的价值买单,比如长期记忆和反馈闭环。

    来自广东 回复
  3. 每日一包这个比喻很精准,但问题是很多团队也知道这样不对,却找不到更好的考核方式。毕竟老板要看到进展,不能半年后才给结果。

    来自广东 回复
  4. 先点出战术勤奋掩盖战略懒惰的核心矛盾,再拆解七个病灶比如每日一包和HiPPO问题,最后落到组织需要从西点军校转向雅典学院。读完感觉很多AI团队都在按错误账本赶路。

    来自广东 回复