过去这一年，AI如何走来——2025年AI大语言模型领域发展历程全面回顾

搜索

APP

起点课堂会员权益

职业体系课特权

线下行业大会特权

个人IP打造特权

30+门专项技能课

1300+专题课程

12场职场软技能直播

12场求职辅导直播

12场专业技能直播

会员专属社群

荣耀标识

发布

过去这一年，AI如何走来——2025年AI大语言模型领域发展历程全面回顾

产品经理崇生

2026-01-10

0 评论 2493 浏览 0 收藏

17 分钟

2025年，AI领域迎来思维链突破、开源模型普及与Agent元年的三重变革。DeepSeek-R1的横空出世不仅打破技术壁垒，更引发全球AI竞赛格局重塑。本文聚焦大语言模型赛道，从国产超车到开源浪潮，从多模态融合到Agent架构升级，带您全景式回顾这场决定未来十年的关键技术角逐。

2025年结束了，在过去这一年里，AI领域的发展可谓波澜壮阔、高潮迭起。思维链的突破，开源模型的普及，AI agent元年……似乎任何一个关键词都无法完整概括这一年的突破。因此，我想好好地梳理一下这一年来AI的发展历程。

AI的相关领域众多，如果要挑一条主线，我认为还是“大语言模型”。因此，本文主要是围绕AI大语言模型领域重要进展进行回顾（这意味着我不得不舍弃诸如Nano Banana、Seedream的更新）。而且哪怕缩小到“大语言模型领域”，相关的进展依然繁多，因此，我将从中挑出重点的事件，以点带面地进行回顾。

让我们一起来看看，过去的2025年这一年，AI如何走来。

1月：“思维链”的突破

年初1月，Kimi、豆包、千问都先后发布了自家大模型的更新版本，但这一阶段主角，显然是属于DeepSeek-R1。

我从去年（2024年）开始投入到AI培训授课的工作当中，当时谈到国产大模型，说法都是“距离美国尚有一代差距，正在奋力追赶”。但DeepSeek-R1的出现彻底改变了这一局面。令人惊叹的模型能力、独立研发的思维链、全面开源的开放性、训练方式的全公开等等，宛如一枚枚惊雷投入AI行业。OpenAI在3月中旬时向美国国会递交行政议案，意图通过行政手段锁死DeepSeek的发展。DeepSeek给行业带来的震动可见一斑。

“虽然美国目前在人工智能领域保持领先，但DeepSeek显示我们的领先优势并不大，而且正在缩小。”——OpenAI

如果各位朋友当时也有留意相关资讯的话，应该对于“ChatGPT对于中文使用者统一降智”的说法还有所印象。是的，当时OpenAI的说法是DeepSeek之所以能够训练出“思维链”，必定是“蒸馏”了OpenAI-O1的回答。（注1：当时OpenAI-O1是唯一内置“思维链”的大模型。注2：模型“蒸馏”是指通过Teacher模型的数据来训练Student模型，从而在提升模型的能力同时缩短训练的耗时。）

当然，OpenAI这一切无中生有的指摘，在当时就已经为业内人士所不齿。而最终盖棺定论的是在9月18日这一天。当天，DeepSeek-R1的训练论文登上《Nature》（自然）杂志的封面文章，成为第一个也是目前唯一一个通过同行评议训练方法的AI大模型，也彻底地宣告OpenAI是纯粹的污蔑。

这里个人也补充一个小点，就是关于Kimi-k1.5模型的。在当时DeepSeek经常“服务器繁忙”的时候，我是曾经多次将Kimi-k1.5作为替代品的。它与DeepSeek-R1是同一天发布，也同样内置了“思维链”能力，个人使用下来的感受是能够达到DeepSeek-R1的80%的表现，也是一次很不错的突破了。当然，其光芒被DeepSeek完全掩盖，只能感叹一句“时也，命也”。

2-5月：“思维链”与开源的全面普及

2025年的上半年，DeepSeek的余波仍在影响着整个行业。国外这边，或许是受了DeepSeek的刺激，各个产品也纷纷加快了模型能力的升级，誓要巩固自己领先者的位置。2月18日，Grok3发布；2月24日，Claude 3.7发布；2月28日，ChatGPT 4.5发布；3月26日，Gemini 2.5 Pro发布；4月17日，o4-mini发布。国内这边，随着DeepSeek训练方式的公布，各个AI团队在认知到原来思维链是可以如此巧妙且简洁地训练出来之后，也纷纷上线了自家大模型的“内置思维链”版本。2月19日，腾讯的Hunyuan T1发布；3月16日，百度的文心X1发布；4月14日，字节的豆包1.5深度思考发布。而搅动旋涡的DeepSeek在3月24日发布DeepSeek-V3-0324，5月28日发布DeepSeek-R1-0528，也在持续提升其模型能力。

DeepSeek的另一个影响便是“开源”。自从DeepSeek全面开源以来，百度、Kimi乃至后续的智谱清言、Minimax等，都在2025年先后宣布将旗下模型进行开源（腾讯、阿里是在此之前就已开源）。由于这里各家产品宣布开源的时间点比较散，我们就不作专门汇总了，只需要知道大部分模型开源这一动作都是在DeepSeek之后即可。

6-9月：推理、代码能力的持续强化与“原生多模态大模型”

进入下半年后，各大AI模型也开始了卷“推理”、卷“代码”能力的竞赛。当然，这些能力在之前的模型更新迭代也会有所提及，但在进入下半年后，它们明显从之前的配角，走到了C位的位置。

这一阶段没有一个严格的起点，但大致可以从5月22日Claude 4发布开始讲起。Claude一直被认为是“编程”领域最强的模型，Claude 4发布也引发了行业广泛关注。随后便是众多产品的“你方唱罢我登台”，真个热闹非凡。6月17日，Minimax-M1发布；7月10日，Grok 4发布；7月11日，Kimi-k2 发布；7月30日，GLM-4.5发布；8月6日，Claude 4.1发布；8月19日，DeepSeek-V3.1发布；9月5日，Kimi-k2-0905 发布；9月9日，文心X1.1 发布；9月20日，Grok 4 Fast发布；9月24日，Qwen3-Max发布；9月30日，GLM-4.6发布。这些模型都在以“强化推理、代码能力”作为核心宣传点。这一阶段，也以9月30日Claude Sonnet 4.5 发布，再一次夯实了其“全球最强代码模型”，作为终点。

另一个值得关注的趋势是“原生多模态大模型”，即将“多模态”融合进模型，成为模型的原生能力。简单理解就是将“理解、思考”能力与“多模态”的读取、生成相结合，成为模型的内置能力。

其实这个领域的进展并没有这么集中，若论开始应该还得追溯到2024年5月发布的ChatGPT4o，而在3月26日，GPT4o 原生生图能力发布，更是让大众看到了“原生多模态”的威力。当时掀起的一轮“宫崎骏”画风创作热度，相信大家还留有印象。同一发展方向的产品动态还有：6月11日，豆包1.6发布；9月26日，Qwen3-Omni 发布；11月13日，文心5.0发布；12月5日，混元2.0发布。这些产品的主打方向之一，就是“原生多模态”能力的突破。

10-12月：“模型即Agent”模式与领先者的赛跑游戏

2025年的最后一个季度，是我个人认为在AI领域发展中最为精彩纷呈的阶段。

首先是AI大模型的又一次重大突破，那便是“模型即Agent”的架构升级。所谓“模型即Agent”，即在模型中内置任务多步骤拆解、推进与工具调用的能力。其目的自然是让AI能够处理更加复杂、庞大的任务。10月27日，Minimax-M2 发布；11月6日，Kimi-k2-Thinking 发布；11月18日，Grok 4.1发布；11月24日，Claude Opus 4.5 发布。从这些产品的发布宣传中，都开始突出其自主调用工具处理复杂任务的Agent能力。

在“模型即Agent”发展的同时，AI领域也进行着一场场比拼，我称之为“领先者的赛跑游戏”。这里需要重点先介绍主角——OpenAI。在连续祭出ChatGPT4.5、O4-mini等模型后，8月8日，OpenAI正式发布了ChatGPT 5，将其原生多模态、推理思维链等能力进行融合；11月13日，发布ChatGPT 5.1，让不同模态间的转换与结合更自然。OpenAI这一系列的动作，持续地维护着自己在AI领域“执牛耳者”的地位。虽然有着Grok、Claude等模型在它后面持续追赶，但仍未有产品能将其拉下来。

然而，这一切随着11月18日Gemini 3.0 Pro发布后，局面发生了变化。Gemini 3.0 Pro以大幅度领先的姿态刷榜各大测评集，第一次以全面领先的姿态超越了一周前发布的ChatGPT 5.1。

Gemini 3.0 Pro在证明Google老牌大厂底蕴的同时，也让Sam Altman紧急宣布OpenAI进入“Code Red”（红色警报）状态，要求调集更多资源来改进 ChatGPT。

中间还穿插着12月1日，携标准版与极致推理“Speciale”版两个模型版本而来的DeepSeep V3.2，在各大测评结果中追平GPT5、Gemini 3.0 Pro。连同前不久的Kimi-k2-Thinking一起，带着开源模型也加入到这场“赛跑游戏”当中。

当然，12月18日，OpenAI发布了ChatGPT 5.2，算是再一次夺回了领先的位置，为2025年年末的这一场“领先者的赛跑游戏”画上一个阶段性的结局。

2025年的收尾，还有12月16日小米 MiMo-V2-Flash 的发布值得关注。它专注在推理效率与代码能力，主要是服务小米的硬件生态。测评表现来看，算是挤进了第一梯队。然后就是12月23日，GLM -4.7的发布，从测评结果来看是坐上了开源模型第一的位置，不过实际使用情况还有待进一步观察。其他诸如豆包1.8、Minimax-M2.1、GLM-4.7等模型的发布，不过也都是现有能力的更新，只能算是这一时期的配角。

就这样，2025年的AI故事，到这里算是画下休止符了。