“雷声大、雨点小”的 AI Agent

搜索

APP

起点课堂会员权益

职业体系课特权

线下行业大会特权

个人IP打造特权

30+门专项技能课

1300+专题课程

12场职场软技能直播

12场求职辅导直播

12场专业技能直播

会员专属社群

荣耀标识

发布

AI Online

2025-10-11

4 评论 3381 浏览 9 收藏

5 分钟

“2025 是 Agent 元年！”—— 这句口号，我去年也喊过。直到我亲手把 12 个 Agent 送进产线，被 3 条数学公式打脸到鼻青脸肿。

人人都在谈 Agent、特别是前段时间的云栖大会上可谓是百花齐放，但真正跑通商业闭环、形成用户粘性的场景仍屈指可数。如果你还在 PPT 上写“让 AI 替代 80% 员工”，建议把这篇文章转发给老板，能救一命。

01 一个“真香”现场

先报背景履历，防止被喷“你行你上”：

数字漂亮吧？

但今晚我只想说：它们每一个，都活在刀口上。

02 第一刀：95% 可靠＝36% 崩溃

公式：0.95²⁰ ≈ 36%

很多朋友可能没听懂，我翻译下：

你单步准确率95%，已经高过人类实习生；
但只要链式20步（写一段代码、跑测试、提交、合并、部署），成功率直接掉到36%；
客户要求99.9%，等于每一步必须99.995%。

现实是：今天最好的 GPT-5 在函数调用评测上只有 96.7%。

所以，凡是在官网写“完全自主多步 workflow”的，一律按骗子处理。

03 第二刀：Token 成本是平方级

公式：Cost ∝ n²

很多人没意识到“对话式”为什么做不起来：

第1轮：1ktokens
第50轮：50×50=2.5ktokens
真实测试：100轮对话单条成本52美元
坐席量1000人→一天烧掉5万美金，比人力还贵

结论：凡是长记忆、长会话的 Agent，都活不过 CFO （首席财务官）这一关。

04 第三刀：工具反馈墙

Agent 调用 API 成功率 98%，但理解返回结果的成功率只有 67%。

为什么？因为真实世界的接口长这样：

我花了 3 周给每个工具写“AI 友好摘要”，才把数据库 Agent 从 67% 拉到 91%。70% 的工作量根本不在模型，而在给工具做“人话翻译”。

05 数据集成坟场

甲方ERP没有API，只有Excel导出
OAuth登录一周一改，Agent直接401
财务系统要求“摘要≤20字”，Agent生成50字直接写入失败

“只要接 API”是世上最毒的鸡汤。

真实集成=70% 胶水代码+25% 重试补偿+5% AI。

06 所以，什么才活得下来？

我总结了“5 大生存原则”，符合的才能活到 2026：

07 给产品经理的 3 句脏话

别再写“支持100步流程”，先写“第1步失败怎么赔”。
把Token单价写进PRD，别让CFO替你写。
每个Agent必须配“一键甩锅”按钮，让人1秒接管。

08 结语：我不是唱衰 Agent，我是唱蠢

AI 没问题，问题是我们用错误的经济模型、错误的心理预期、错误的产品定义，去造一座空中楼阁。

真正赚钱的 Agent，都长得像“工具”而不是“人”。真正赚钱的公司，都把 AI 藏在后面，把确定性留给了客户。

2025，让我们少谈“替代人类”，别做 Agent 泡沫的炮灰，多谈“人类放心把后背交给它”。

最后也欢迎各位大佬一起来探讨，你心中的Agent是怎样的。

本文由 @AI Online 原创发布于人人都是产品经理。未经作者许可，禁止转载

题图来自Unsplash，基于CC0协议

更多精彩内容，请关注人人都是产品经理微信公众号或下载App

AI Online

分享野生AI产品经理的升级打怪之旅

14篇作品 30213总阅读量

双十一反消费，36万人加入“不买组”

11-012370 浏览

2023年，做不好内容，等于失去半条命

01-037682 浏览

明星主播接连「塌房」，这一届直播电商不好带？

09-132143 浏览

我在抖音开咖啡店，多久能回本？

03-293764 浏览

东方甄选，无需做中国的山姆

02-093626 浏览

汪仔6588

人們太高估ai的能力了，打個比方，我是視覺設計方面從業人員，ai“自由”生圖確實比起一年前質量提升很多，但是設計是根據需求來做的，當需求具體到畫面的指定物件、元素、ip、ip形象的動作、場景構成都是訂製的時候，ai是無法達標的，我們能做的是拆解成一個個模塊，然後測試和梳理能讓ai聽得懂的話、是圖、後期製作去推進。總體來說確實比純人力快，但並非老闆們心目中的——可以完全取代人力——終究只是一個輔助手段。
提一個ai繪圖的agent，主打“自然語言”就能理解需求，看似比起一些老牌工具需要參數操作來的方便，實際上反而更難，因為“自然語言”的表達方式沒有參數化的方式來的科學和理性，ai很難準確理解需求，對於具體設計需求的理解效果普遍很糟糕。

最近来自北京回复
1. AI Online 作者回复汪仔6588
  
  是的，目前还是一个强人机交互的过程，现阶段AI还是在辅助人，要做到AI有决策或者人辅助AI，还需要市场以及研究人员共同努力
  
  最近来自浙江回复
叶子佳

很喜欢一句话：人类对ai的幻觉，远比ai输出给人类的大。除了一些有意兜售概念哄骗投资人/老板的投机者外，任何人都不应错误的定位ai

最近来自湖北回复
1. AI Online 作者回复叶子佳
  
  确定存在有人恶意兜售概念，真正的心声还得是来自于市场
  
  最近来自浙江回复