“雷声大、雨点小”的 AI Agent
“2025 是 Agent 元年!”—— 这句口号,我去年也喊过。 直到我亲手把 12 个 Agent 送进产线,被 3 条数学公式打脸到鼻青脸肿。

人人都在谈 Agent、特别是前段时间的云栖大会上可谓是百花齐放,但真正跑通商业闭环、形成用户粘性的场景仍屈指可数。如果你还在 PPT 上写“让 AI 替代 80% 员工”,建议把这篇文章转发给老板,能救一命。
01 一个“真香”现场
先报背景履历,防止被喷“你行你上”:

数字漂亮吧?
但今晚我只想说:它们每一个,都活在刀口上。
02 第一刀:95% 可靠=36% 崩溃
公式:0.95²⁰ ≈ 36%
很多朋友可能没听懂,我翻译下:
- 你单步准确率95%,已经高过人类实习生;
- 但只要链式20步(写一段代码、跑测试、提交、合并、部署),成功率直接掉到36%;
- 客户要求99.9%,等于每一步必须99.995%。
现实是:今天最好的 GPT-5 在函数调用评测上只有 96.7%。
所以,凡是在官网写“完全自主多步 workflow”的,一律按骗子处理。

03 第二刀:Token 成本是平方级
公式:Cost ∝ n²
很多人没意识到“对话式”为什么做不起来:
- 第1轮:1ktokens
- 第50轮:50×50=2.5ktokens
- 真实测试:100轮对话单条成本52美元
- 坐席量1000人→一天烧掉5万美金,比人力还贵
结论:凡是长记忆、长会话的 Agent,都活不过 CFO (首席财务官)这一关。
04 第三刀:工具反馈墙
Agent 调用 API 成功率 98%,但理解返回结果的成功率只有 67%。
为什么?因为真实世界的接口长这样:

我花了 3 周给每个工具写“AI 友好摘要”,才把数据库 Agent 从 67% 拉到 91%。70% 的工作量根本不在模型,而在给工具做“人话翻译”。
05 数据集成坟场
- 甲方ERP没有API,只有Excel导出
- OAuth登录一周一改,Agent直接401
- 财务系统要求“摘要≤20字”,Agent生成50字直接写入失败
“只要接 API”是世上最毒的鸡汤。
真实集成=70% 胶水代码+25% 重试补偿+5% AI。
06 所以,什么才活得下来?
我总结了“5 大生存原则”,符合的才能活到 2026:

07 给产品经理的 3 句脏话
- 别再写“支持100步流程”,先写“第1步失败怎么赔”。
- 把Token单价写进PRD,别让CFO替你写。
- 每个Agent必须配“一键甩锅”按钮,让人1秒接管。
08 结语:我不是唱衰 Agent,我是唱蠢
AI 没问题,问题是我们用错误的经济模型、错误的心理预期、错误的产品定义,去造一座空中楼阁。
真正赚钱的 Agent,都长得像“工具”而不是“人”。 真正赚钱的公司,都把 AI 藏在后面,把确定性留给了客户。
2025,让我们少谈“替代人类”,别做 Agent 泡沫的炮灰,多谈“人类放心把后背交给它”。
最后也欢迎各位大佬一起来探讨,你心中的Agent是怎样的。
本文由 @AI Online 原创发布于人人都是产品经理。未经作者许可,禁止转载
题图来自Unsplash,基于CC0协议

起点课堂会员权益




人們太高估ai的能力了,打個比方,我是視覺設計方面從業人員,ai“自由”生圖確實比起一年前質量提升很多,但是設計是根據需求來做的,當需求具體到畫面的指定物件、元素、ip、ip形象的動作、場景構成都是訂製的時候,ai是無法達標的,我們能做的是拆解成一個個模塊,然後測試和梳理能讓ai聽得懂的話、是圖、後期製作去推進。總體來說確實比純人力快,但並非老闆們心目中的——可以完全取代人力——終究只是一個輔助手段。
提一個ai繪圖的agent,主打“自然語言”就能理解需求,看似比起一些老牌工具需要參數操作來的方便,實際上反而更難,因為“自然語言”的表達方式沒有參數化的方式來的科學和理性,ai很難準確理解需求,對於具體設計需求的理解效果普遍很糟糕。
是的,目前还是一个强人机交互的过程,现阶段AI还是在辅助人,要做到AI有决策或者人辅助AI,还需要市场以及研究人员共同努力
很喜欢一句话:人类对ai的幻觉,远比ai输出给人类的大。 除了一些有意兜售概念哄骗投资人/老板的投机者外,任何人都不应错误的定位ai
确定存在有人恶意兜售概念,真正的心声还得是来自于市场