最近几个月的AI大模型独立应用实践-3-大模型解决不了一切

0 评论 388 浏览 0 收藏 9 分钟

大模型并非万能解药,其底层概率机制决定了与生俱来的局限性。从概率模型原理、信息衰减到人类主观因素,本文层层剖析为何GPT、Gemini等AI无法解决所有问题,更揭示知识压缩与采样机制带来的幻觉风险。当技术遇上复杂人性,这场认知革命仍面临根本性挑战。

今天我们来简单聊一个话题——那就是,大模型不能解决一切问题。

这篇文章,我们分三个方面来论证一下,为什么大模型不能解决一切问题。

首先我们将从目前阶段大模型的底层原理来讨论一下。

然后我们从信息的衰减来讨论一下。

最后从人这个角度来讨论一下。

一、目前阶段大模型的底层原理

目前大语言模型的核心原理就是概率学(更准确地说,是一个超大规模的条件概率模型),大模型(如GPT、Claude、Gemini、deepseek、千问等)本质上都在做同一件事

给定一段上文,预测下一个词(token)的概率分布,然后从这个分布中采样出一个词,把它拼到上文里,再预测下一个词……如此循环,生成整段回复。

模型说“太阳从东边升起”时,并不是它“知道”这个天文事实,而是因为在海量文本里,“太阳”和“东边”共现的概率远高于“西边”。整个智能表现,都建立在词语层面的概率关系上。

概率模型产生幻觉的根源有几层:

1、概率高 ≠ 事实正确

模型在训练数据里见过无数“哥伦布发现了美洲大陆”,也见过极少量恶搞或错误文本里写“哥伦布发现了印度”。模型最大化的是“语言上的合理性”,而不是事实准确性。在某些上下文中,一个完全错误但语法通顺的句子概率并不低。

2、知识被压缩成统计印象,没有“真值校验器”

模型内部没有一个事实数据库,也没有一个“这是真的/假的”二值判断模块。所有知识都被压缩在百亿、千亿的参数里,呈现为模糊的关联强度。当你问一个冷门知识,它可能把几个相似但错误的记忆“揉”成一个很像真的答案。

3、长尾知识的概率被稀释

高频事实(比如地球是圆的)概率极高,很难出错。但对于长尾、小众、需要精确匹配的信息(比如某冷门法规的第三款第二条),正确组合的概率可能并不比一个“看上去对”的错误组合高,模型就容易瞎编。

4、采样机制本身允许“走偏”

生成时为了保持多样性和创造性,模型会从概率分布里做随机采样,而不是永远选概率最高的那个词。这就像你写文章时偶尔会冒出一个“异想天开”的词,这个“异想天开”有时就滑向幻觉。

所以从根源上看,幻觉是概率语言模型与生俱来的“影子”,不可能彻底消灭,因为模型的底层目标就不是“求真”,而是“拟合语言的概率分布”。

当然,我们可以通过一些工程手段来吧幻觉概率降低:

检索增强生成(RAG):不让模型仅凭自己的“参数记忆”回答,而是先从一个外部知识库(文档、数据库)检索出相关事实片段,然后让模型基于这些可溯源的材料来组织语言。这样就把“事实来源”外挂了,模型的概率只是负责把事实串成通顺的话。

用工具和代码验证:涉及计算、查询精确信息时,让模型调用计算器、搜索引擎、API,而不是凭概率“编”结果。比如“帮我算一下19234.5 ÷ 17”,模型直接写代码执行,而不是预测数字。

强化学习与人类反馈 & 事实性对齐:在训练阶段,刻意惩罚那些“听起来像真的但实际错误”的答案,奖励模型说“我不知道”。这样可以微调模型的概率分布,让它更倾向于承认不确定性,而不是强行生成一个概率尚可的错答案。

思维链与自我校验:让模型在内部多步推理,并在生成后自我检查是否有矛盾、违反常识,这种多步过程可以修正部分低级的幻觉。

如果我们要求的是 “在任何开放域问题上,零幻觉” ,那答案是:只要还是纯概率自回归模型,就做不到。

二、信息始终存在衰减

我之前在一篇文章中有讨论过一个点,那就是真实世界的所有信息量如果是100的话,那么我们人类目前所有从真实世界中获取的信息是60左右(甚至更少),然后我们提供给大模型进行训练的知识可能只有30-40左右。

也就是我们人类都不能完全完整的认识这个世界,而且万事万物在不断变化,我们人类收集、整理获取的信息始终有限。以这个有限的信息去训练模型,那么这个模型必然也会受到限制。

更不要说,人类的信息中会存在很多垃圾信息,错误信息,非一手信息。比如说我们常说的商业信息,如果不是亲临一线,获取一手资料,只是从网络上扒信息,那么这些信息的价值又有几何呢?

我们策划各种商业项目的时候,整个方案从逻辑上是完全闭环的,为什么项目一旦进入实际商业社会运行的时候,就显得牛头不对马嘴呢。这就是因为我们拿的信息没有真实的反应实际情况,或者拿到的信息不全面。

三、人

即便我们拿到了最全面的信息,我们人也会从过往形成的价值观、主观偏好上来解读拿到的信息。

模型本身也是被训练出了价值观或者其他的偏向性,那么如何保证模型不会对信息进行曲解呢?

这些大模型公司背后团队的价值观和偏向性就一定客观公正吗?

使用大模型的人,他的价值观和主观偏好又该怎么规避呢?

我们也知道,信息在传统企业中是非常重要的,有很多人在传递信息到其他团队和下级的时候,可以隐瞒部分信息,来形成权力垄断。这种情况充斥着大大小小,传统或者现代的行业和公司,那这种情况我们凭什么会认为在有了大模型之后就不会存在呢?

各种之前就存在的灰色部分,难道就不会存在了吗?

我不会这样认为,只要有人存在,人与人之间存在博弈和竞争,那么就必然会有对信息的控制,必然有很多灰色部分存在。这些部分,大模型是无力解决的。

所以,综上所属,我不认为大模型能够解决一切问题。

下一篇文章,我们会聊聊,从我自己的实践和与其他人沟通,在目前阶段,大模型适合解决哪些问题和不能解决哪些问题。

本文由人人都是产品经理作者【markzou】,微信公众号:【markzou的笔记】,原创/授权 发布于人人都是产品经理,未经许可,禁止转载。

题图来自Unsplash,基于 CC0 协议。

更多精彩内容,请关注人人都是产品经理微信公众号或下载App
评论
评论请登录
  1. 目前还没评论,等你发挥!