Claude Opus 4.8发布了，人的幻觉愈发严重 | 人人都是产品经理

APP

起点课堂会员权益

职业体系课特权

线下行业大会特权

个人IP打造特权

30+门专项技能课

1300+专题课程

12场职场软技能直播

12场求职辅导直播

12场专业技能直播

会员专属社群

荣耀标识

{{ userInfo.member ? '查看权益' : '开通会员' }}

发布

注册 | 登录

Claude Opus 4.8发布了，人的幻觉愈发严重

秀琴江湖飘

2026-05-31

0 评论 1862 浏览 0 收藏

9 分钟

Claude Opus 4.8 的发布带来了三个关键变化：学会说「我不确定」的动态工作流、可调节的思考强度档位，以及预告中的 Mythos 模型。这些更新不仅提升了模型的可靠性，更展现了 AI 在代码迁移等复杂任务中的潜力。然而，文章犀利指出当前企业应用 AI 时普遍存在的三种幻觉，揭示了理想与现实之间的巨大鸿沟。

昨天晚上claude Opus 4.8发布了，不得不感慨，模型迭代的速度太快了。

这次最大的变化，说出来你可能觉得好笑

claude学会说「我不确定」了。

以前的版本有个毛病，遇到不懂的东西它会硬着头皮编。不是故意的，是真的觉得自己懂了。就像一个喝了酒的朋友，你跟他说什么他都接得上话，讲得头头是道，但全是胡扯。

Opus 4.8 改了，碰到拿不准的东西会主动举手说这个我不太确定，你要不要再确认一下。

然后是一个听起来有点吓人的功能，叫动态工作流。说白了就是能同时派几百个小弟一起干活。

Bun 的作者用这个功能把整个项目从 Zig 语言搬到 Rust 语言，生成了多少代码？

七十五万行，跑了十一天。测试通过率百分之九十九点八。

反正我对这件事是保持存疑的。

当然也不是什么都行。Terminal-Bench 这个考试，还是没考过 GPT-5.5。人家七十八分，我七十四。就差了四分，但这四分差得很稳定，像极了当年你同桌数学永远比你高那么几分，你换了好几种学习方法都没用。

还有一个功能是现在可以调「思考强度」了。分五档，低中高超高最大。简单问题用低档，便宜又快。

复杂问题调到最大，会多想一会儿。这个设计有点像你去按摩店，技师问你力道够不够，你可以说轻点，也可以说用力。只不过这里按的不是背，是你的 prompt。

价格没涨。标准模式的价格跟上一代一模一样，快速模式反而降了三分之二。没涨价的原因我猜有两个，一个是 Anthropic 还算厚道，另一个可能是确实不好意思涨，毕竟隔壁也在盯着。

对了，还预告说接下来几周会放出一个更强的模型叫 Mythos。据说预览版已经帮五十家公司找到了一万多个安全漏洞。我没见过 Mythos 本人，但听这描述，大概就是那种别人家孩子的感觉——还没正式上学呢，已经拿了一堆奖。

说完了模型发布的内容，我想下面说点真实的AI应用场景。

我观察了一下身边的朋友，关注AI就两个方面，一个是领导下的是任务，必须研究。另一个则是怕被AI世界遗弃，赶紧报班学习。

从来不是说，AI太棒了，我已经完全不需要干活了。但真不需要自己干活了，又害怕自己完全没有价值了。

突然想到一个办公室场景：老板问你，这个想法这么快，而且这么完美，你是咋做的？

你想给领导分享AI工具，心想这玩意太强了，嘴到嘴边，又吐了出去，因为害怕。害怕领导知道自己用了AI，发现比自己都好用。这一点我认为是国内大部分AI应用层面，迟迟在chat，普通聊天层面的首要原因。

AI是什么？只需要帮我查询资料、提供情绪价值、我说你错了你就是错了，我说我不开心，你会帮我点杯奶茶。

当然这是普通AI使用者的想法。

面对CEO来说，截然相反，巴不得一个部门AI智能体、10个人干的活，我现在让一个人干了，哪怕多开三倍工资、人也高兴，活也干的漂亮。

上个月和一个朋友吃饭，他在一家中型公司做产品总监。

饭吃到一半他突然放下筷子，说了一句我到现在都忘不了的话。他说，我们CEO上周参加了一个AI峰会，回来之后像换了个人。周一全员会上，CEO当着一百多号人说，三个月之内，AI要接管我们公司百分之四十的工作流程。

我问他，然后呢。

他说，三个月过去了，唯一的成果是行政部用AI生成会议纪要。

我俩笑了半天。但说实话，笑完我觉得这件事一点都不好笑。

我管它叫人工智能幻觉。不是AI的幻觉，是人得了幻觉，AI只是碰巧当了那个药引。

我总结了三种幻觉。

1、替代幻觉：核心症状是一句话——「这个东西可以替代XX团队」。XX可以是客服、可以是设计、可以是初级程序员、可以是文案。

说这句话的时候CEO的眼神通常是亮的，语气是笃定的。但他没有想过一个问题。能用AI替代的工作，通常是他根本不了解的工作。

他以为客服就是接电话，不知道一个好的客服要能在用户发火的时候把对方情绪稳住，要能在公司内部流程卡住的时候想办法绕过去，要能在客户说「我要退费」的时候判断这是真的想退还是在试探底线。

这些东西AI一个都做不了。不是现在做不了，是这件事本身就不是技术能解决的。

2、钢铁侠幻觉：感觉AI是无敌的，你不会用是你的事。比如让你研发一套AISRM，但是对于页面布局、功能描述、需求背景啥都没有。他说你也太落后了，现在AI都是你一句话，直接帮你生成部署。那还要这么多东西。

3、零成本幻觉：核心症状是——「上了AI就能降本增效」。这句话单独听没问题，问题出在「就能」这两个字上。

我见过一家电商公司，CEO决定用AI客服全面替代人工。实施第一个月，客服成本确实降了百分之四十。第二个月，退货率涨了百分之二十，差评涨了百分之三十五。

第三个月，人工客服又招回来了，而且比之前还多了三个——因为被AI得罪的用户得用更多的人力去哄回来。

你会发现这三种幻觉有一个共同点。都不是AI出了问题，是使用AI的那个人，在用一个完全脱离现实的认知去指挥一个他完全不理解的东西。

清醒的人是怎么想AI的。

他们不把AI当神，也不当废物。

他们把AI当成一个工具箱。这个箱子里有几件非常好用的工具，有很多还在打磨的半成品，也有不少根本就不是工具只是看起来像工具的玩意儿。

工作不是抱着这个箱子说它什么都能干，也不是把它扔在角落里落灰。你的工作是打开箱子，一件一件拿出来试，找出哪几件对你的具体业务真的有帮助，然后只深入用那几件。

这件事没有捷径。你听再多AI峰会的keynote也没用，你看再多咨询公司的AI趋势报告也没用。

只有你自己上手用过，你才知道什么能做什么不能做。只有你自己在那个具体场景里踩过坑，你才知道为什么不能用AI全面替代客服。

以上！吧啦的有点多了，见谅。

本文由人人都是产品经理作者【秀琴江湖飘】，微信公众号：【秀琴江湖飘】，原创/授权发布于人人都是产品经理，未经许可，禁止转载。

题图来自作者提供

更多精彩内容，请关注人人都是产品经理微信公众号或下载App

秀琴江湖飘

公众号《秀琴江湖飘》从思考到深度！

36篇作品 191957总阅读量

半年积累10万+私域用户，创造2000万私域GMV，母婴品牌可优比是如何运营私域？

08-092806 浏览

半年积累10万+私域用户，创造2000万私域GMV，母婴品牌可优比是如何运营私域？

可被抵消的用户衰退——存量用户运营之道

08-085385 浏览

可被抵消的用户衰退——存量用户运营之道

「短」内容为王的时代来了，这会写手们最好的时代么？

07-313962 浏览

「短」内容为王的时代来了，这会写手们最好的时代么？

618回归“价格战”：京东淘宝进入存量竞争，小红书、视频号深入电商直播

06-092325 浏览

618回归“价格战”：京东淘宝进入存量竞争，小红书、视频号深入电商直播

透过 Vision Pro看MR结合AIGC带来的机遇与方向

06-126416 浏览

透过 Vision Pro看MR结合AIGC带来的机遇与方向

评论

目前还没评论，等你发挥！