Claude Opus 4.8发布了,人的幻觉愈发严重
Claude Opus 4.8 的发布带来了三个关键变化:学会说「我不确定」的动态工作流、可调节的思考强度档位,以及预告中的 Mythos 模型。这些更新不仅提升了模型的可靠性,更展现了 AI 在代码迁移等复杂任务中的潜力。然而,文章犀利指出当前企业应用 AI 时普遍存在的三种幻觉,揭示了理想与现实之间的巨大鸿沟。

昨天晚上claude Opus 4.8发布了,不得不感慨,模型迭代的速度太快了。
这次最大的变化,说出来你可能觉得好笑
claude学会说「我不确定」了。
以前的版本有个毛病,遇到不懂的东西它会硬着头皮编。不是故意的,是真的觉得自己懂了。就像一个喝了酒的朋友,你跟他说什么他都接得上话,讲得头头是道,但全是胡扯。
Opus 4.8 改了,碰到拿不准的东西会主动举手说这个我不太确定,你要不要再确认一下。
然后是一个听起来有点吓人的功能,叫动态工作流。说白了就是能同时派几百个小弟一起干活。
Bun 的作者用这个功能把整个项目从 Zig 语言搬到 Rust 语言,生成了多少代码?
七十五万行,跑了十一天。测试通过率百分之九十九点八。
反正我对这件事是保持存疑的。
当然也不是什么都行。Terminal-Bench 这个考试,还是没考过 GPT-5.5。人家七十八分,我七十四。就差了四分,但这四分差得很稳定,像极了当年你同桌数学永远比你高那么几分,你换了好几种学习方法都没用。
还有一个功能是现在可以调「思考强度」了。分五档,低中高超高最大。简单问题用低档,便宜又快。
复杂问题调到最大,会多想一会儿。这个设计有点像你去按摩店,技师问你力道够不够,你可以说轻点,也可以说用力。只不过这里按的不是背,是你的 prompt。
价格没涨。标准模式的价格跟上一代一模一样,快速模式反而降了三分之二。没涨价的原因我猜有两个,一个是 Anthropic 还算厚道,另一个可能是确实不好意思涨,毕竟隔壁也在盯着。
对了,还预告说接下来几周会放出一个更强的模型叫 Mythos。据说预览版已经帮五十家公司找到了一万多个安全漏洞。我没见过 Mythos 本人,但听这描述,大概就是那种别人家孩子的感觉——还没正式上学呢,已经拿了一堆奖。
说完了模型发布的内容,我想下面说点真实的AI应用场景。
我观察了一下身边的朋友,关注AI就两个方面,一个是领导下的是任务,必须研究。另一个则是怕被AI世界遗弃,赶紧报班学习。
从来不是说,AI太棒了,我已经完全不需要干活了。但真不需要自己干活了,又害怕自己完全没有价值了。
突然想到一个办公室场景:老板问你,这个想法这么快,而且这么完美,你是咋做的?
你想给领导分享AI工具,心想这玩意太强了,嘴到嘴边,又吐了出去,因为害怕。害怕领导知道自己用了AI,发现比自己都好用。这一点我认为是国内大部分AI应用层面,迟迟在chat,普通聊天层面的首要原因。
AI是什么?只需要帮我查询资料、提供情绪价值、我说你错了你就是错了,我说我不开心,你会帮我点杯奶茶。
当然这是普通AI使用者的想法。
面对CEO来说,截然相反,巴不得一个部门AI智能体、10个人干的活,我现在让一个人干了,哪怕多开三倍工资、人也高兴,活也干的漂亮。
上个月和一个朋友吃饭,他在一家中型公司做产品总监。
饭吃到一半他突然放下筷子,说了一句我到现在都忘不了的话。他说,我们CEO上周参加了一个AI峰会,回来之后像换了个人。周一全员会上,CEO当着一百多号人说,三个月之内,AI要接管我们公司百分之四十的工作流程。
我问他,然后呢。
他说,三个月过去了,唯一的成果是行政部用AI生成会议纪要。
我俩笑了半天。但说实话,笑完我觉得这件事一点都不好笑。
我管它叫人工智能幻觉。不是AI的幻觉,是人得了幻觉,AI只是碰巧当了那个药引。
我总结了三种幻觉。
1、替代幻觉:核心症状是一句话——「这个东西可以替代XX团队」。XX可以是客服、可以是设计、可以是初级程序员、可以是文案。
说这句话的时候CEO的眼神通常是亮的,语气是笃定的。但他没有想过一个问题。能用AI替代的工作,通常是他根本不了解的工作。
他以为客服就是接电话,不知道一个好的客服要能在用户发火的时候把对方情绪稳住,要能在公司内部流程卡住的时候想办法绕过去,要能在客户说「我要退费」的时候判断这是真的想退还是在试探底线。
这些东西AI一个都做不了。不是现在做不了,是这件事本身就不是技术能解决的。
2、钢铁侠幻觉:感觉AI是无敌的,你不会用是你的事。比如让你研发一套AISRM,但是对于页面布局、功能描述、需求背景啥都没有。他说你也太落后了,现在AI都是你一句话,直接帮你生成部署。那还要这么多东西。
3、零成本幻觉:核心症状是——「上了AI就能降本增效」。这句话单独听没问题,问题出在「就能」这两个字上。
我见过一家电商公司,CEO决定用AI客服全面替代人工。实施第一个月,客服成本确实降了百分之四十。第二个月,退货率涨了百分之二十,差评涨了百分之三十五。
第三个月,人工客服又招回来了,而且比之前还多了三个——因为被AI得罪的用户得用更多的人力去哄回来。
你会发现这三种幻觉有一个共同点。都不是AI出了问题,是使用AI的那个人,在用一个完全脱离现实的认知去指挥一个他完全不理解的东西。
清醒的人是怎么想AI的。
他们不把AI当神,也不当废物。
他们把AI当成一个工具箱。这个箱子里有几件非常好用的工具,有很多还在打磨的半成品,也有不少根本就不是工具只是看起来像工具的玩意儿。
工作不是抱着这个箱子说它什么都能干,也不是把它扔在角落里落灰。你的工作是打开箱子,一件一件拿出来试,找出哪几件对你的具体业务真的有帮助,然后只深入用那几件。
这件事没有捷径。你听再多AI峰会的keynote也没用,你看再多咨询公司的AI趋势报告也没用。
只有你自己上手用过,你才知道什么能做什么不能做。只有你自己在那个具体场景里踩过坑,你才知道为什么不能用AI全面替代客服。
以上!吧啦的有点多了,见谅。
本文由人人都是产品经理作者【秀琴江湖飘】,微信公众号:【秀琴江湖飘】,原创/授权 发布于人人都是产品经理,未经许可,禁止转载。
题图来自作者提供
- 目前还没评论,等你发挥!

起点课堂会员权益




