拒绝 AI 智商税:你的供应商是在卖AI 能力,还是在堆AI 名词?
本文探讨了从BERT到LLM的AI认知演变,指出BERT虽曾伟大但已非前沿,呼吁企业关注AI能力链路而非单一模型。

——从BERT 到 LLM:为什么你的AI 认知还停在 2018?
最近看到一个公司的介绍,写得斩钉截铁:
我们使用 BERT 模型实现精准情感识别,效果远超传统算法。
我看完愣了几秒。
倒不是BERT有什么问题,但是我们已经来到了 2025 年。
BERT 的确是伟大的发明,但它诞生于 2018。
对于技术更新速度以季度为单位的 AI 行业来说,这几乎已经是一段历史。但为什么现在仍然有一些团队,把它当成黑科技包装?
所以今天这篇文章想讨论的是一个更关键的问题:你的AI认知,是否也停留在 2018?
第一部分:BERT 是什么?为什么它曾经很牛?
用一句最直白的话说:
BERT 是让 NLP 从关键词匹配进化到理解语言的那次巨大飞跃。
它是 Google 在 2018 年提出的 Encoder 模型,擅长做:
- 情感分析
- 文本分类
- 匹配任务
- 自动摘要……
它的历史地位类似第一台自动挡汽车。方便、可靠、稳定,而且曾一度引领行业。
在它出现之前,中文 NLP 主要还在靠关键词匹配、规则体系、简单神经网络。
它确实让 NLP 走向了现代工业化时代。但它的时代性功能已经完成。
它从前沿突破变成了AI 基础设施。就像 MySQL 仍然被广泛使用,但没人会把它当成数据库黑科技去卖高价。
理解这一点很重要: 无关BERT好不好,而是时代已经往前走了。
第二部分:为什么 2025 年还很多人在用 BERT 当卖点?
这是一个典型的行业变革期现象。旧的技术还在商用,新技术已经普及,但甲方、乙方、供应商的认知速度不一样。
于是 BERT 就出现了延迟带的效应。
下面是四个完全现实、完全合理的原因:
1)因为它好卖
很多甲方分不清 BERT、GPT、Embedding、Transformer。
他们只听到一个词:AI。 只要包装专业、名词唬人、流程清晰就能卖。
2)因为它便宜、部署稳定、风险低
BERT是开源的,部署简单,跑在 CPU/GPU 上都行。
对于供应商来说:成本低、风险可控、交付速度快、不用应对 LLM 的幻觉问题
于是它变成了一条非常稳定的交付链路。
3)因为它 可解释性高
相比之下,大语言模型是概率黑箱,调不好、训不稳、还要面对不确定性。而 BERT 的 pipeline:输入 → 编码 → 分类 → 输出,每一步都能解释。非常线性,能清楚告诉客户:为什么这个文本是负面而不是正面。
4)因为行业还处在从模型思维向能力链路思维过渡的阶段
过去十年的数据公司习惯于:训练模型、调参数、优化 F1-score
而现在大模型时代的核心已经变成:
- 能不能理解上下文
- 能不能推理
- 能不能串流程
- 能不能自动行动
这是一次范式迁移,不是所有团队都能立刻跨过去。
这不是落后,这是行业自身的进化节奏。
第三部分:BERT 的能力边界在哪里?
你可以把 BERT 想象成一个能判断一句话情绪,但不理解场景、不提炼逻辑、不做决策的专家
- 它的边界非常明确:它理解,但不推理
- 它做 token-level 编码,不是知识层建模
- 它无法进行复杂上下文推断
- 它无法处理模糊语义
- 它不能给出为什么
- 更无法处理多模态
于是你就会看到BERT 擅长识别情绪,但无法告诉你用户为什么情绪不好。
所以如果一个系统声称用 BERT 做:舆情深度分析、用户策略洞察、生成内容策略、自动应对方案
那基本可以判断:它的底层逻辑仍然停留在 2018–2020 的框架。
这不代表不好。
它是那个时代稳定、成熟、工业级可用的解决方案。
只是它不是未来。
第四部分:LLM 时代的真正趋势是什么?
如果说 BERT 时代是模型时代,看的是谁的模型准确率更高,那么 LLM 时代则是能力时代,看的是谁能把理解、推理、生成、行动串成一个可落地的智能链路?
下面这四个趋势决定了未来五年的 AI 产品形态:
趋势 1:从模型到能力层
企业真正想买的不是模型,而是:
- 知识库
- 理解层
- 推理层
- 生成层
- 动作层
- 工作流工具链
也就是能力链路的整合,而不是模型切片。
趋势 2:从分类到策略链路
过去是简单的情绪判断:正面 / 负面 / 中性
现在要变成:识别 → 原因 → 策略 → 文案生成 → 行动执行
这是一个完整链路,而不再是标签。
趋势 3:从单点算法到AI 工作流协同
现在行业领先者都在做:LLM × RAG × 工作流 × 工具调用
这才是真正能落地的 AI 系统。
趋势 4:从供应商到智能中枢伙伴
企业不再想买一个情感分析模型。
- 他们想要的是:从洞察到行动的完整体系
- 与业务融合的智能中枢
- 可复用的能力平台
第五部分:如何判断一个公司是在用老技术忽悠你?
BERT 是历史功臣,它让中文 NLP 有了第一次工业级跃迁。
所以我们现在讨论的是如何接续:
从模型能力 → 到系统能力 → 再到智能链路能力。
如果一个系统:
- 全文只提 BERT / TextCNN / LSTM→ 大概率停留在 2018–2020
- 结果只有分类,没有解释能力→ 旧技术特征
- 不能跨模态→ 旧框架
- 不能推理,不讲 RAG,不讲工作流,不讲链路能力→ 认知层级落后
那它大概率停在模型时代。
而市场正在走向AI能力时代。
写在最后
技术是否最先进并不是最重要的。
重要的是,我们能不能站在 2025 年的视角重新理解AI的价值结构。
BERT 是历史功臣,但不应该再被当成时代武器。
未来属于能驾驭理解 + 推理 + 行动链路的一整套智能系统。
这就是为什么很多公司的 AI 看起来能跑,却跑不动业务。因为它还停在过去。
每一个时代更新都不会一夜之间完成。
AI 不仅仅是算法。
AI是能力体系,是业务链路,是组织进化。
我们都值得拥有更好的方法论。
本文由 @Mio的AI商业观察 原创发布于人人都是产品经理。未经作者许可,禁止转载
题图来自Unsplash,基于CC0协议
- 目前还没评论,等你发挥!

起点课堂会员权益




