过去这一年,AI如何走来——2025年AI大语言模型领域发展历程全面回顾
2025年,AI领域迎来思维链突破、开源模型普及与Agent元年的三重变革。DeepSeek-R1的横空出世不仅打破技术壁垒,更引发全球AI竞赛格局重塑。本文聚焦大语言模型赛道,从国产超车到开源浪潮,从多模态融合到Agent架构升级,带您全景式回顾这场决定未来十年的关键技术角逐。

2025年结束了,在过去这一年里,AI领域的发展可谓波澜壮阔、高潮迭起。思维链的突破,开源模型的普及,AI agent元年……似乎任何一个关键词都无法完整概括这一年的突破。因此,我想好好地梳理一下这一年来AI的发展历程。
AI的相关领域众多,如果要挑一条主线,我认为还是“大语言模型”。因此,本文主要是围绕AI大语言模型领域重要进展进行回顾(这意味着我不得不舍弃诸如Nano Banana、Seedream的更新)。而且哪怕缩小到“大语言模型领域”,相关的进展依然繁多,因此,我将从中挑出重点的事件,以点带面地进行回顾。
让我们一起来看看,过去的2025年这一年,AI如何走来。
1月:“思维链”的突破
年初1月,Kimi、豆包、千问都先后发布了自家大模型的更新版本,但这一阶段主角,显然是属于DeepSeek-R1。

我从去年(2024年)开始投入到AI培训授课的工作当中,当时谈到国产大模型,说法都是“距离美国尚有一代差距,正在奋力追赶”。但DeepSeek-R1的出现彻底改变了这一局面。令人惊叹的模型能力、独立研发的思维链、全面开源的开放性、训练方式的全公开等等,宛如一枚枚惊雷投入AI行业。OpenAI在3月中旬时向美国国会递交行政议案,意图通过行政手段锁死DeepSeek的发展。DeepSeek给行业带来的震动可见一斑。


“虽然美国目前在人工智能领域保持领先,但DeepSeek显示我们的领先优势并不大,而且正在缩小。”——OpenAI
如果各位朋友当时也有留意相关资讯的话,应该对于“ChatGPT对于中文使用者统一降智”的说法还有所印象。是的,当时OpenAI的说法是DeepSeek之所以能够训练出“思维链”,必定是“蒸馏”了OpenAI-O1的回答。(注1:当时OpenAI-O1是唯一内置“思维链”的大模型。注2:模型“蒸馏”是指通过Teacher模型的数据来训练Student模型,从而在提升模型的能力同时缩短训练的耗时。)
当然,OpenAI这一切无中生有的指摘,在当时就已经为业内人士所不齿。而最终盖棺定论的是在9月18日这一天。当天,DeepSeek-R1的训练论文登上《Nature》(自然)杂志的封面文章,成为第一个也是目前唯一一个通过同行评议训练方法的AI大模型,也彻底地宣告OpenAI是纯粹的污蔑。

这里个人也补充一个小点,就是关于Kimi-k1.5模型的。在当时DeepSeek经常“服务器繁忙”的时候,我是曾经多次将Kimi-k1.5作为替代品的。它与DeepSeek-R1是同一天发布,也同样内置了“思维链”能力,个人使用下来的感受是能够达到DeepSeek-R1的80%的表现,也是一次很不错的突破了。当然,其光芒被DeepSeek完全掩盖,只能感叹一句“时也,命也”。
2-5月:“思维链”与开源的全面普及
2025年的上半年,DeepSeek的余波仍在影响着整个行业。国外这边,或许是受了DeepSeek的刺激,各个产品也纷纷加快了模型能力的升级,誓要巩固自己领先者的位置。2月18日,Grok3发布;2月24日,Claude 3.7发布;2月28日,ChatGPT 4.5发布;3月26日,Gemini 2.5 Pro发布;4月17日,o4-mini发布。国内这边,随着DeepSeek训练方式的公布,各个AI团队在认知到原来思维链是可以如此巧妙且简洁地训练出来之后,也纷纷上线了自家大模型的“内置思维链”版本。2月19日,腾讯的Hunyuan T1发布;3月16日,百度的文心X1发布;4月14日,字节的豆包1.5深度思考发布。而搅动旋涡的DeepSeek在3月24日发布DeepSeek-V3-0324,5月28日发布DeepSeek-R1-0528,也在持续提升其模型能力。


DeepSeek的另一个影响便是“开源”。自从DeepSeek全面开源以来,百度、Kimi乃至后续的智谱清言、Minimax等,都在2025年先后宣布将旗下模型进行开源(腾讯、阿里是在此之前就已开源)。由于这里各家产品宣布开源的时间点比较散,我们就不作专门汇总了,只需要知道大部分模型开源这一动作都是在DeepSeek之后即可。

6-9月:推理、代码能力的持续强化与“原生多模态大模型”
进入下半年后,各大AI模型也开始了卷“推理”、卷“代码”能力的竞赛。当然,这些能力在之前的模型更新迭代也会有所提及,但在进入下半年后,它们明显从之前的配角,走到了C位的位置。
这一阶段没有一个严格的起点,但大致可以从5月22日Claude 4发布开始讲起。Claude一直被认为是“编程”领域最强的模型,Claude 4发布也引发了行业广泛关注。随后便是众多产品的“你方唱罢我登台”,真个热闹非凡。6月17日,Minimax-M1发布;7月10日,Grok 4发布;7月11日,Kimi-k2 发布;7月30日,GLM-4.5发布;8月6日,Claude 4.1发布;8月19日,DeepSeek-V3.1发布;9月5日,Kimi-k2-0905 发布;9月9日,文心X1.1 发布;9月20日,Grok 4 Fast发布;9月24日,Qwen3-Max发布;9月30日,GLM-4.6发布。这些模型都在以“强化推理、代码能力”作为核心宣传点。这一阶段,也以9月30日Claude Sonnet 4.5 发布,再一次夯实了其“全球最强代码模型”,作为终点。

另一个值得关注的趋势是“原生多模态大模型”,即将“多模态”融合进模型,成为模型的原生能力。简单理解就是将“理解、思考”能力与“多模态”的读取、生成相结合,成为模型的内置能力。

其实这个领域的进展并没有这么集中,若论开始应该还得追溯到2024年5月发布的ChatGPT4o,而在3月26日,GPT4o 原生生图能力发布,更是让大众看到了“原生多模态”的威力。当时掀起的一轮“宫崎骏”画风创作热度,相信大家还留有印象。同一发展方向的产品动态还有:6月11日,豆包1.6发布;9月26日,Qwen3-Omni 发布;11月13日,文心5.0发布;12月5日,混元2.0发布。这些产品的主打方向之一,就是“原生多模态”能力的突破。


10-12月:“模型即Agent”模式与领先者的赛跑游戏
2025年的最后一个季度,是我个人认为在AI领域发展中最为精彩纷呈的阶段。
首先是AI大模型的又一次重大突破,那便是“模型即Agent”的架构升级。所谓“模型即Agent”,即在模型中内置任务多步骤拆解、推进与工具调用的能力。其目的自然是让AI能够处理更加复杂、庞大的任务。10月27日,Minimax-M2 发布;11月6日,Kimi-k2-Thinking 发布;11月18日,Grok 4.1发布;11月24日,Claude Opus 4.5 发布。从这些产品的发布宣传中,都开始突出其自主调用工具处理复杂任务的Agent能力。

在“模型即Agent”发展的同时,AI领域也进行着一场场比拼,我称之为“领先者的赛跑游戏”。这里需要重点先介绍主角——OpenAI。在连续祭出ChatGPT4.5、O4-mini等模型后,8月8日,OpenAI正式发布了ChatGPT 5,将其原生多模态、推理思维链等能力进行融合;11月13日,发布ChatGPT 5.1,让不同模态间的转换与结合更自然。OpenAI这一系列的动作,持续地维护着自己在AI领域“执牛耳者”的地位。虽然有着Grok、Claude等模型在它后面持续追赶,但仍未有产品能将其拉下来。


然而,这一切随着11月18日Gemini 3.0 Pro发布后,局面发生了变化。Gemini 3.0 Pro以大幅度领先的姿态刷榜各大测评集,第一次以全面领先的姿态超越了一周前发布的ChatGPT 5.1。


Gemini 3.0 Pro在证明Google老牌大厂底蕴的同时,也让Sam Altman紧急宣布OpenAI进入“Code Red”(红色警报)状态,要求调集更多资源来改进 ChatGPT。

中间还穿插着12月1日,携标准版与极致推理“Speciale”版两个模型版本而来的DeepSeep V3.2,在各大测评结果中追平GPT5、Gemini 3.0 Pro。连同前不久的Kimi-k2-Thinking一起,带着开源模型也加入到这场“赛跑游戏”当中。

当然,12月18日,OpenAI发布了ChatGPT 5.2,算是再一次夺回了领先的位置,为2025年年末的这一场“领先者的赛跑游戏”画上一个阶段性的结局。


2025年的收尾,还有12月16日小米 MiMo-V2-Flash 的发布值得关注。它专注在推理效率与代码能力,主要是服务小米的硬件生态。测评表现来看,算是挤进了第一梯队。然后就是12月23日,GLM -4.7的发布,从测评结果来看是坐上了开源模型第一的位置,不过实际使用情况还有待进一步观察。其他诸如豆包1.8、Minimax-M2.1、GLM-4.7等模型的发布,不过也都是现有能力的更新,只能算是这一时期的配角。
就这样,2025年的AI故事,到这里算是画下休止符了。


小结一下
2025年确实是AI风云变幻的一年。我们共同见证DeepSeek的横空出世,见证国产模型的集体跃进,见证OpenAI与Gemini之间的你追我赶,见证整个业界探索无数种可能。本文的短短三千余字,或许仅能挂一漏万。若有不当之处,限于个人笔力,那也只能是无可奈何了。
2025年也已经过去,但AI的故事不会完结。如我们所知,AI这场竞赛,是一场马拉松式的长跑,一时的领先,也真的就只是“一时的领先”。真可谓“AI代有才品出,各领风骚数百天”。在这样一个风云激荡的年代,永远都有意想不到的破局者出现。
最后,在新的一年里,希望AI业界能够贡献给我们越来越多的好产品,希望国产AI大模型能够从以往的追赶姿态,逐渐追平,直到成为AI潮流趋势的引领者。
本文由人人都是产品经理作者【产品经理崇生】,微信公众号:【崇生的黑板报】,原创/授权 发布于人人都是产品经理,未经许可,禁止转载。
题图来自Unsplash,基于 CC0 协议。
- 目前还没评论,等你发挥!

起点课堂会员权益



