大模型开源开发趋势报告:企业与开发者的必修课

0 评论 455 浏览 0 收藏 7 分钟

2025 年,蚂蚁开源联合 Inclusion AI 发布《全球大模型开源开发生态全景与趋势报告(2.0 版)》,通过筛选 Github 全域项目(含 114 个项目、覆盖 22 个技术领域),呈现大模型开源生态核心态势:领域迭代迅猛(62% 项目诞生于 2022 年 “GPT 时刻” 后),中美主导 36 万开发者市场,传统开源定义被打破,AIAgent 聚焦 AI Coding 等方向、AIInfra 侧重模型运维与全生命周期管理,基座模型青睐 MoE 架构等技术。

蚂蚁开源联合 Inclusion AI 在 2025 年发布了 2.0 版《全球大模型开源开发生态全景与趋势报告》(下文简称“报告”)。报告直接对Github下面的全域项目进行检索,通过分析开发者、项目、社区之间的互动关系,评估各大大模型开源项目的影响力和开发者的贡献度。

相比于今年5月份发布的1.0版本,报告剔除了1.0版本中的60个项目,新纳入了39个项目,可以说是非常客观的反映了当前开源生态下的技术和产品趋势。如下图所示,大模型开源开发生态全景图中共有114个项目,覆盖22个技术领域,整体分为AIAgentAIInfra两大方向。

(图源 https://antoss-landscape.my.canva.site/)

报告从这100+项目中萃取以下观点:

1、大模型开发领域迭代极快。约62%的项目诞生于 2022 年“GPT 时刻”之后,项目平均“年龄”仅约 30 个月,说明该领域迭代极快。

2、在大模型生态中中国和美国占主导地位。参与这些项目的全球开发者约36 万人,其中美国约占 24%、中国约占 18%,其次是印度、德国、英国等。

3、传统的软件开源定义逐步被颠覆。比如Dify、n8n等热门开源项目都在开源许可上增加了用户使用的限制,以保护自己的商业利益。比如Cursor等闭源项目并没有在Github发布代码,但通过Github收集用户反馈。

4、在AI Agent层面,以AI Coding、聊天机器人、Agent开发框架为核心增长领域。尤其是AI Coding,目前面向开发者的产品形态有CLI、IDE、插件、协作开发工作流4种形态,产品功能也从最开始代码补全升级到全栈式开发和项目协作。

(图源 蚂蚁开源公众号)

5、在AI Infra层面,以模型运维、模型全生命周期管理为核心增长领域,关注是的如何一站式地完成大模型训练、评测和部署,以及可靠地进行大模型在线服务。值得一提的是,像英伟达等大厂也在布局Infra开源工具,以建造供自身商业化产品发展的技术护城河。

(图源 蚂蚁开源公众号)

6、在基座大模型技术架构层面,MoE专家混合架构逐渐被各大厂商所青睐,这种架构一方面允许模型在训练时可以构建更多参数的网络,另一方面通过动态路由等手段降低了推理时的参数激活,减少了计算成本。基于强化学习的Reasoning能力也成为很多模型的必备能力,支持用户根据不同的问题场景使用不同的推理方式。同时,多模态模型成为今年发布的焦点,无论是视频、图像等生成都给到一些惊喜。下图是蚂蚁开源整理的从2025年1月-8月的基座大模型发布情况,可以清楚地印证这些观点。

(图源 蚂蚁开源公众号)

从报告中对大模型生态的分析,我们可以获得一些启发:

1、大模型工程化的能力很重要,比如工具调用、可靠服务、推理优化等,这些将成为影响大模型融于业务场景的关键因素。

2、自研产品和技术的核心部门需要闭源,但是周边的通用能力可以开源,从而拥抱大模型开源生态的注意力红利。

3、报告强调要关注大模型项目的快速更迭与社区协作,建议在选型开源项目时,不能仅仅看star数,而是要参考项目提交频率、issue 处理、贡献者分布、依赖生态等来决定是否在生产使用。

参考

https://mp.weixin.qq.com/s/QRY5HBtZwrCZ95WHubTwsg

本文由人人都是产品经理作者【明思AI】,微信公众号:【明思AI】,原创/授权 发布于人人都是产品经理,未经许可,禁止转载。

题图来自Unsplash,基于 CC0 协议。

更多精彩内容,请关注人人都是产品经理微信公众号或下载App
评论
评论请登录
  1. 目前还没评论,等你发挥!