最近几个月的AI大模型独立应用实践-3-大模型解决不了一切

搜索

APP

起点课堂会员权益

职业体系课特权

线下行业大会特权

个人IP打造特权

30+门专项技能课

1300+专题课程

12场职场软技能直播

12场求职辅导直播

12场专业技能直播

会员专属社群

荣耀标识

发布

最近几个月的AI大模型独立应用实践-3-大模型解决不了一切

markzou

2026-05-26

0 评论 767 浏览 0 收藏

9 分钟

大模型并非万能解药，其底层概率机制决定了与生俱来的局限性。从概率模型原理、信息衰减到人类主观因素，本文层层剖析为何GPT、Gemini等AI无法解决所有问题，更揭示知识压缩与采样机制带来的幻觉风险。当技术遇上复杂人性，这场认知革命仍面临根本性挑战。

今天我们来简单聊一个话题——那就是，大模型不能解决一切问题。

这篇文章，我们分三个方面来论证一下，为什么大模型不能解决一切问题。

首先我们将从目前阶段大模型的底层原理来讨论一下。

然后我们从信息的衰减来讨论一下。

最后从人这个角度来讨论一下。

一、目前阶段大模型的底层原理

目前大语言模型的核心原理就是概率学（更准确地说，是一个超大规模的条件概率模型），大模型（如GPT、Claude、Gemini、deepseek、千问等）本质上都在做同一件事

给定一段上文，预测下一个词（token）的概率分布，然后从这个分布中采样出一个词，把它拼到上文里，再预测下一个词……如此循环，生成整段回复。

模型说“太阳从东边升起”时，并不是它“知道”这个天文事实，而是因为在海量文本里，“太阳”和“东边”共现的概率远高于“西边”。整个智能表现，都建立在词语层面的概率关系上。

概率模型产生幻觉的根源有几层：

1、概率高 ≠ 事实正确

模型在训练数据里见过无数“哥伦布发现了美洲大陆”，也见过极少量恶搞或错误文本里写“哥伦布发现了印度”。模型最大化的是“语言上的合理性”，而不是事实准确性。在某些上下文中，一个完全错误但语法通顺的句子概率并不低。

2、知识被压缩成统计印象，没有“真值校验器”

模型内部没有一个事实数据库，也没有一个“这是真的/假的”二值判断模块。所有知识都被压缩在百亿、千亿的参数里，呈现为模糊的关联强度。当你问一个冷门知识，它可能把几个相似但错误的记忆“揉”成一个很像真的答案。

3、长尾知识的概率被稀释

高频事实（比如地球是圆的）概率极高，很难出错。但对于长尾、小众、需要精确匹配的信息（比如某冷门法规的第三款第二条），正确组合的概率可能并不比一个“看上去对”的错误组合高，模型就容易瞎编。

4、采样机制本身允许“走偏”

生成时为了保持多样性和创造性，模型会从概率分布里做随机采样，而不是永远选概率最高的那个词。这就像你写文章时偶尔会冒出一个“异想天开”的词，这个“异想天开”有时就滑向幻觉。

所以从根源上看，幻觉是概率语言模型与生俱来的“影子”，不可能彻底消灭，因为模型的底层目标就不是“求真”，而是“拟合语言的概率分布”。

当然，我们可以通过一些工程手段来吧幻觉概率降低：

检索增强生成（RAG）：不让模型仅凭自己的“参数记忆”回答，而是先从一个外部知识库（文档、数据库）检索出相关事实片段，然后让模型基于这些可溯源的材料来组织语言。这样就把“事实来源”外挂了，模型的概率只是负责把事实串成通顺的话。

用工具和代码验证：涉及计算、查询精确信息时，让模型调用计算器、搜索引擎、API，而不是凭概率“编”结果。比如“帮我算一下19234.5 ÷ 17”，模型直接写代码执行，而不是预测数字。

强化学习与人类反馈 & 事实性对齐：在训练阶段，刻意惩罚那些“听起来像真的但实际错误”的答案，奖励模型说“我不知道”。这样可以微调模型的概率分布，让它更倾向于承认不确定性，而不是强行生成一个概率尚可的错答案。

思维链与自我校验：让模型在内部多步推理，并在生成后自我检查是否有矛盾、违反常识，这种多步过程可以修正部分低级的幻觉。

如果我们要求的是 “在任何开放域问题上，零幻觉” ，那答案是：只要还是纯概率自回归模型，就做不到。

二、信息始终存在衰减

我之前在一篇文章中有讨论过一个点，那就是真实世界的所有信息量如果是100的话，那么我们人类目前所有从真实世界中获取的信息是60左右（甚至更少），然后我们提供给大模型进行训练的知识可能只有30-40左右。

也就是我们人类都不能完全完整的认识这个世界，而且万事万物在不断变化，我们人类收集、整理获取的信息始终有限。以这个有限的信息去训练模型，那么这个模型必然也会受到限制。

更不要说，人类的信息中会存在很多垃圾信息，错误信息，非一手信息。比如说我们常说的商业信息，如果不是亲临一线，获取一手资料，只是从网络上扒信息，那么这些信息的价值又有几何呢？

我们策划各种商业项目的时候，整个方案从逻辑上是完全闭环的，为什么项目一旦进入实际商业社会运行的时候，就显得牛头不对马嘴呢。这就是因为我们拿的信息没有真实的反应实际情况，或者拿到的信息不全面。

三、人

即便我们拿到了最全面的信息，我们人也会从过往形成的价值观、主观偏好上来解读拿到的信息。

模型本身也是被训练出了价值观或者其他的偏向性，那么如何保证模型不会对信息进行曲解呢？

这些大模型公司背后团队的价值观和偏向性就一定客观公正吗？

使用大模型的人，他的价值观和主观偏好又该怎么规避呢？

我们也知道，信息在传统企业中是非常重要的，有很多人在传递信息到其他团队和下级的时候，可以隐瞒部分信息，来形成权力垄断。这种情况充斥着大大小小，传统或者现代的行业和公司，那这种情况我们凭什么会认为在有了大模型之后就不会存在呢？

各种之前就存在的灰色部分，难道就不会存在了吗？

我不会这样认为，只要有人存在，人与人之间存在博弈和竞争，那么就必然会有对信息的控制，必然有很多灰色部分存在。这些部分，大模型是无力解决的。

所以，综上所属，我不认为大模型能够解决一切问题。

下一篇文章，我们会聊聊，从我自己的实践和与其他人沟通，在目前阶段，大模型适合解决哪些问题和不能解决哪些问题。

本文由人人都是产品经理作者【markzou】，微信公众号：【markzou的笔记】，原创/授权发布于人人都是产品经理，未经许可，禁止转载。

题图来自Unsplash，基于 CC0 协议。

更多精彩内容，请关注人人都是产品经理微信公众号或下载App

markzou

公号：markzou的笔记；8年产品生涯，专注本地生活、新零售

93篇作品 818970总阅读量

09-059911 浏览

02-159588 浏览

12-0210063 浏览

12-218291 浏览

07-064714 浏览

目前还没评论，等你发挥！

产品周报276期 | Google发布AI大模型Gemini，腾讯NOW直播宣布12月26日停止运营

12-082530 浏览
ToB业务的核心，是帮助你的客户完成他的经营指标

03-135988 浏览
华为盘古，过河拆“Chat”

07-113094 浏览