腾讯元宝,10 个亿红包远远不够

0 评论 173 浏览 0 收藏 18 分钟

在AI助手元宝的测试中,腾讯的这款产品暴露了三大核心问题:对网络梗文化的理解缺失、微信生态内的链接断裂,以及缺乏人类独有的联想能力。从六小龄童的'国际巨星'到'麦片'的语义联想失败,再到视频号推荐算法的混乱,元宝展现出的不仅是技术局限,更是AI产品在中文互联网语境下的适应困境。

我看不懂,但我大受震撼!

很难想象,腾讯,竟然采用现金红包——这一10 年前移动互联网时代的打法推广自家的 AI 产品——元宝派。

打铁还得自身硬,元宝,你真的准备好了吗?

01.元宝为什么不理解梗文化

前段时间,我在腾讯新闻上看到一条西游记相关的新闻,用户在评论区发了一个问句:

什么叫国际巨星啊?

只见新闻妹 AI(已改名元宝),回复到 国际巨星 的字面释义。

什么叫国际巨星啊?

什么叫国际巨星啊,这个名场面来自六小龄童的一次活动采访结束时,说的一句话,而且说完之后,往椅子上一靠,一副舍我其谁的霸气,被网友称之为:战术后仰。

后来被网友用来 形容某人明明很普通,却有舍我其谁的自信感。

还有另一条评论是:这次有没有麦片?

只见新闻妹 AI 同样是依据字面释义,回复是:麦片相关的介绍。

麦片这个明场面,特指 六小龄童 在西游记导演杨洁的追悼会现场接受采访时,不合适宜的推荐自己的新电影而遭到口诛笔伐。

事实上,评论区的网友也并不是真的在问问题,只是在刷西游记中孙悟空扮演者六小龄童的一个个名场面。

拿这两条评论而言,懂的网友都懂,这只是在 玩梗。

而元宝并未准确 get,那么,是因为元宝训练数据过时或缺失吗?

针对这个问题,我先查询了下元宝训练日期,显示: 训练数据截止到 2024 年 7 月,这说明数据已经涵盖了。

那我来直接问下元宝好了:

元宝竟然能做出准确的回复。

说明元宝确实有数据。

基于此,从侧面说明 元宝 至少存在有以下三个问题:

1. 元宝并没有针对(这条)新闻做出 上下文 的处理操作。

如果没在这条新闻下边,单独来看:什么叫国际巨星啊?

确实是个普通的问句,按字面意思理解,元宝是完全指令遵从 /笑哭。

但把『什么叫国际巨星啊』这句话和『六小龄童』放在一起时,就不能按字面意思理解了。

这里就需要进行上下文的关联处理。

But,元宝并没有。

2. 有数据也无法在上下文中准确 get 到错别字或同音字?

再来看看 麦片 名场面。

元宝给出了的回复,说 六小龄童 有代言 麦片广告。

但这次元宝,它错了。

而且错的离谱。

一方面是,六小龄童压根没代言过麦片广告。

于是我尝试着追问它:

请给出具体参考的来源或代言麦片的品牌、商家、和时间。

结果 元宝说:查了下,六小龄童确实没有代言过麦片广告。

我:。。。

元宝,你这是一本正经的 胡说八道啊(这 AI 幻觉有点离谱)。

刚才的 AI 幻觉你可能觉得不算什么,但如果 AI 是外科医生呢?

给出了错误的指令呢?哪怕它只有 0.5% 的幻觉概率?这可是人命关天啊。

二方面是,元宝 也并未准确识别到(基于上下文)同音字(仅能按字面意思理解)。

它无法推理得出当 麦片 与 六小龄童 同时出现的场景下,麦片就意同『卖片』啊。

这算是 AI 中关于语义模糊理解的缺失吗?

3. 元宝缺失人类独有的联想能力

玩梗是文化的一部分,当用户在评论区发出 :什么叫国际巨星啊 这个问句时,看到的网友会秒懂,哈哈一笑。

而这几乎就是下意识的,甚至无法用言语表达的那种立即心领神会、只可意会不可言传的那种微妙感觉。

显然,元宝 AI 现在还不具备这样的联想能力(且当前世面上所有的 AI 都不具备)。

AI 只会把任何话当成文案或指令处理,丝毫没有情绪上的波动。

不像人类看到晚霞会联想到前年旅行时的轻松愉悦。

不像人类听到旋律会联想到那些看再也回去的青春岁月、激动落泪。

不像人类观看体育会联想到学生时代的年少轻狂而自然舞动。

02 元宝在微信生态内的链路并未完全打通

通过这两张截图,相信你一眼就能看出来,也会有和我一样的疑问:

为什么搜索 CSP ,而通过视频号的内容光看封面就知道,这和当前上下文中的 CSP毫无关联?

为什么搜索 狄克推多,而视频号的内容,也和当前上下文中毫无关联?

为什么搜索 血海,视频号的内容同样和当前上下文中毫无关联?

等等,这样的 case 太多了。

这背后透漏出元宝或微信至少存在以下 4 个问题:

第 1 个,视频号的推荐内容与上下文完全无关。

无效的信息对于用户而言,反而是一种非常不友好 的信息噪音。

当然也可能是视频号还未完全与元宝互联互通,无法根据上下文的信息,实现精准匹配,目前仅能实现上文提到的字面文字、关键字匹配。

第 2 个,推荐的视频号内容与上下文无关,那好歹得与我个人画像或标签相匹配吧。

但,并没有。

CSP 考试与我个人无关,完全无关,我也没在微信内讨论和阅读过任何关于 CSP 考试的内容(为什么视频号推荐与我无关内容)。

狄克推多 与我个人无关,完全无关,我不看动漫、二次元也不玩游戏(为什么视频号推荐与我无关内容)。

血海与我个人无关,完全无关,我不懂中_医,也从来不曾关注(为什么视频号推荐与我无关内容)。

第 3 个,考虑到上下文环境了,但视频号里『碰巧』完全没有对应的内容。

没有内容,那为什么还要强推不相关的视频号内容给用户呢?

图文不行吗?

当然这可能受限于微信列表推荐策略。

比如紧跟 AI 搜索结果列表,第二位必须且只能推视频号。

但拜托啊,视频号里完全没有对应的关键字匹配内容,那就不能根据上下文环境以及对关键字语义理解后,匹配到同类的视频号内容推送过来吗?

那么,我的疑问又来了,我还有第 4 个问题:

如果语义理解后,还没匹配到现有的视频号的内容,那么,为什么不能实时、直接调用元宝 AI 的即时生成能力?

那么,根据上下文 即时 生成一段(AIGC) 视频内容 (作为次一级内容)填充到一个官方视频号上呢?(Just like 元宝小课堂?)

那么,这样实现,应该是不难的吧?

又不是没那条件(不号称有万张 H100 的卡吗?)

03.元宝,任重道远,志远路遥

刚好前两天,遇到这样一个场景,我的确需要元宝帮我『记住』这件小事,而且是主动且静默。

这件锁碎小事会存在以下潜在的需求:

  1. 对方有可能会忘记通知我要找的人。
  2. 我可能也会忘记这件小事,比如我下午去开会了,等到了第 3 天才想起来这茬。
  3. 元宝能否择机替我询问或再次确认下这件事?省的我在发消息询问?

当然,这背后可能需要元宝至少具备以下 8 点能力:

1. 持续感知, 始终在线 Always-On

在微信生态内,元宝得时刻知晓、感知(7*24)到我做了什么。

不需要通过文本 Prompt 唤醒,而是无处不在、持续在线。

2. 具备长时记忆或持久记忆

元宝得能记住我所说过的每一句话和做过的每一件事,包括但不限于聊天记录、图片(甚至图片中的内容)、阅读的公众号文章、消费习惯。

尤其是针对跨对话的上下文记忆的连续性。

比如我前几天随口和好友聊过说不能吃辣的,会直接影响到今天视频号和公众号文章的相关推荐内容。

3. 理解和解释

元宝得能理解哪些信息是重要的,哪些属于废话,可以忽略。

比如刚才截图中的场景对于我来说这事太琐碎,太小了,但又不能忘记。

元宝得能理解和知道我有一件小事目前还没闭环,可能需要后续跟进。

元宝得能深入理解这背后的意图。

4. 静默推理

元宝推理时不能影响我正常使用啊。

你得可以 甚至必须在端侧设备(如手机、Mac、Pad、PC 等)的后台静默完成一切因果推理工作。(为什么不是云端,还不是为了用户隐私)。

包括但不限于我的 ToDo、内容偏好、潜在兴趣、社交关系、语文理解等等。

或者换个说法:Calm Computing 平静计算?

5. 主动服务-ProactiveAgents

不只是被动回复,而是 主动观察环境,预判我的需求。

并且懂得 在 合适的时间点 主动介入。

如刚才截图中的场景中,元宝得适时代替我介入,在合适的时候再确认下:宝儿,这件事 OK 了吗?

它得学会有『眼力劲』,在我未有明确指令前,就主动完成 TODO。

6. 归纳总结亦或复盘

有点类似 ChatGPT 去年推出的 Pulse 功能,元宝能做到每天告知我昨天有哪些 TODO,已完成了哪些,甚至进阶到能让我拿来当日报来用。

比如昨天微信群内用户反馈了 10 个bug,已解决 9 个(根据对聊天记录分析、理解、推理得出)。

等等。

7. 用户个性化专属

个性化是必要且必须的。

相比大而全的通用型 AI 助手,元宝得能根据我的真实生活轨迹,给予个人相关性、专属性的个性化匹配,并进化为深度理解用户个人语境的专属助手。

不是千人千面,而是一人一面(这才算是护城河吧,当下 AI 用户没有任何忠诚度可言,亦或者说只对最强 AI 有粘性,今天 Deepseek 刷榜,用户就切换,明天 ChatGPT 更新版本,用户会同样追随。)

8. 容错率

元宝作为用户 C 端的 AI 助手,容错率是一个非常重要的指标。

哪怕 1% 的错误对于用户都是不可接受的(即使 99% 的情况都能应对自如)。

就像文章开头提到的幻觉,还一本正经胡说八道,你能忍?

想象一下,你第二天醒来,发现 AI 已经帮你把房子卖了,只因你昨天和老婆说到楼下邻居的房子售出,狠狠的赚了一笔,要是价格合适也想这么干。

上哪讲道理去?

你不能只决策,不负责啊。

当然,我刚才所有的设想、畅想也都只是在用后视镜看未来,只是用人类已有旧范式去类比和想象。

就像当初人类只是把 汽车当成更快的 马车。

但没人在 100 年前就能预见,汽车将重塑人类整个世界以及给城市和生活方式带来的改变。

以上。

PS:本文仅以腾讯元宝举例,字节跳动的豆包和阿里的通义千问是否也存在雷同问题暂且未测试。

PPS:腾讯、阿里、百度,最近竟然都在采用现金红包、免单补贴——这一 10 年前国内移动互联网时代的打法推广自家的 AI 产品:元宝派、千问、文心。

不客气的讲,如果你旗下的 AI ,做不到像 DeepSeek、NanoBanana 、ClawdBot 一样病毒式爆发性的自我增长,别说 10 个亿,100 个亿,投下去也只是听个响。去年初 DeepSeek 横空出世,一分钱推广没花却拿了亿级用户,让Kimi 的 7 个亿规模的营销投放,显得就像个 Joke。

PPPS:兄弟们,上个月的抢的豆包手机,还在用吗?

本文由人人都是产品经理作者【大伟说电商】,微信公众号:【大伟说电商】,原创/授权 发布于人人都是产品经理,未经许可,禁止转载。

题图来自Unsplash,基于 CC0 协议。

更多精彩内容,请关注人人都是产品经理微信公众号或下载App
评论
评论请登录
  1. 目前还没评论,等你发挥!