DeepSeek给大家留出了准备空间
DeepSeek V4落地后没掀桌,对阿里、腾讯、月暗都是好消息。这一轮发布全是“Preview”预览版,没人敢喊是真正的新一代。关键变量在两个地方:谁能率先做出更适配Agent范式的突破,谁能把性价比打到更低。国产模型用便宜价格达到闭源模型90%性能的机会空间正在打开。

这是《窄播Weekly》的第88期,本周我们关注的商业动态是:大模型的发布。过去10天,大模型新品密集发布,看似竞争激烈,但各方的力量对比却并未有大的改变,整个行业都还处于一种过渡状态。
4月24日,DeepSeek V4发布成为这轮大模型密集上新的压轴戏。在此之前,OpenAI和腾讯在4月23日分别推出了GPT 5.5和Hy3 preview,月之暗面和阿里分别在4月20日发布了Kimi K2.6和Qwen3.6-Max-Preview,Anthropic则在4月16日发布了新模型Claude Opus 4.7。
大家期盼已久的DeepSeek V4,并没有像当初R1发布时那样带来颠覆性的技术突破。反倒是它对国产芯片的适配能力,成了新模型发布后的第一讨论落点。甚至,这两天还冒出了一种「国产模型默契同行」的积极论调。
但我们更关心的,是DeepSeek V4落地之后,牌桌上的力量对比究竟变了多少。
首先,DeepSeek这次没掀桌,对阿里、腾讯、月之暗面、MiniMax、智谱来说,都算是个好消息。阿里、腾讯此前刚经历大模型团队调整,这下多了些恢复时间;月之暗面也没被DeepSeek彻底封死估值空间;MiniMax、智谱还能继续吃上龙虾热带来的收入增长。
其次,格局变化不大的根本原因在于:这一轮发布的模型大多还处于过渡状态,没有掀桌的势能。各家一边发新模型,一边预告更强模型或更高性价比——龙虾才刚亮出潜力,由大模型驱动的Agent竞赛,远没到最激烈的时候。
关键的变量,会出现在两个地方:一是谁能率先做出更适配Agent范式的研究突破,二是谁能把性价比打到更低。
01 过渡阶段的产物
这一轮发布有个明显特征:「Preview」(预览版)成了高频词,没人敢喊这是「真正的新一代大模型」。除了都需要更长时间来应对Agent爆发这个技术刚需,各个企业自身也都需要做更多准备来迎接真正激烈的竞争。
第三方机构SemiAnalysis认为DeepSeek V4是「一个特殊的工程版本」,「紧随前沿水平之后」,可以作为美国闭源大模型的低成本替代品。但要真正延续极致性价比,DeepSeek还需要等待国产芯片超节点批量上市,为其提供充足的高端算力保障,将Pro版模型的API价格打下来。
月之暗面虽然表示Kimi K2.6是目前最好的代码模型,但也提到了K2.6是为K3准备的起飞跑道。从数据上看,Kimi K2.6是一个万亿参数的MoE多模态模型,32B激活参数,256K上下文。相比之下,Gemini、Qwen和DeepSeek都已经开始支持百万级的超长上下文。
腾讯的Hy3 preview总参数295B,激活参数21B,最大支持256K上下文长度。腾讯首席AI科学家姚顺雨将其称为混元大模型重建的第一步,期望「获得来自开源社区和用户的真实反馈,帮助提升Hy3正式版的实用性。」也就是说,雷峰网消息报道的将在五六月份发布的Hy3闭源旗舰版本,可能才是姚顺雨真正要交的卷。
阿里的Qwen3.6-Max-Preview也被描述成新一代千问旗舰模型的早期预览版,还在积极开发,持续迭代。阿里在林俊旸风波之后获得广泛关注的视频模型HappyHorse与世界模型HappyOyster,都出自刚被划归ATH事业群的原淘天集团未来生活实验室,而经历大变动的基础模型团队还没有拿出能证明自己的模型。
在海外,Anthropic在Claude Opus 4.7之外,还有一个据说很强的Mythos;GPT 5.5也没有被行业看作是一个划时代的产品。
02 服务Agent是新阶段的核心
小米大模型团队负责人罗福莉一直在强调,大模型技术正处于从Chat到Agent范式的快速转变过程中。小米此前发布的旗舰基座模型Xiaomi MiMo-V2-Pro,以及全模态基座模型Xiaomi MiMo-V2-Omni和语音合成模型Xiaomi MiMo-V2-TTS,被她称作是为Agent时代打造的首个全栈模型家族。
在DeepSeek和月之暗面发布的信息中,也都在强调新模型对Agent能力的强化。DeepSeek V4针对Claude Code、OpenClaw、OpenCode、CodeBuddy等主流Agent产品进行了专项适配和优化。Kimi K2.6引入Agent集群架构,支持300个子Agent并行协作。
这些技术也在DeepSeek和月之暗面的工作中得到了检验。DeepSeek内部员工已经把DeepSeek V4 Pro当作日常Agentic Coding工具使用,交付质量接近Claude Opus 4.6非思考模式。月之暗面的RL基础设施团队用Kimi K2.6驱动的Agent在负责监控、故障响应和系统运维,能连续运行5天。
未来的模型竞争是围绕服务Agent进行的。相比Chat阶段,强调真正交付结果的Agent阶段,会让好模型的价值迅速膨胀。
这种膨胀目前已经体现在大模型公司的收入增长上。智谱经历了多次涨价,但市场需求依然供不应求,调用量增长了400%。Kimi K2.5上线20天的收入已经超过了月之暗面2025年的全年收入。Anthropic的ARR(年度经常性收入)也来到了300亿美元。这种增长也推高了大模型公司的市值或估值。
罗福莉在接受张小珺访谈时表示,接下来两三个月会非常精彩。她认为,在Agent范式阶段,大家都处在同一起跑线上。接下来,团队的研究水平、技术敏捷度,以及拥抱新范式的能力,将决定谁能跑出来——现在怎么决策,很可能就决定了半年后哪个模型更领先。
03 性价比会带来更大空间
从大的竞争层面来看,美国的闭源模型依然处于领先地位,DeepSeek、月之暗面的比较对象,都不是OpenAI和Anthropic的最新模型。但中美大模型之间也并未拉开断层式的差距。这就让中国大模型有可能用性价比争取更大的发展空间——用很便宜的价格达到美国闭源大模型90%的性能。
目前,DeepSeek新一代模型的最贵价格是每百万token输入价格12元(缓存命中1元),输出价格24元;Kimi K2.6的价格是每百万token输入价格6.5元(缓存命中1.1元),输出价格27元。即便较前代模型有所上涨,也仍然远低于GPT-5.5的每百万token输出30美元的定价。而且,这种价格优势还有可能在国产芯片的加持下被进一步放大。
对于有充足资源使用欧美顶尖闭源模型的用户而言,他们需要衡量模型的API价格与其所能替代的生产力价值。
这就像C端用户购买大模型产品的会员,不是花钱越多、性能越高,就越适合自己。最高档位往往对应最强的功能,但大部分人都用不到这么强的功能。同样,欧美用户在购买模型API时,更多会考虑性价比。这就是中国大模型正在获取的机会空间。
还有一个机会场景是没能力使用欧美顶尖闭源模型,甚至也没能力购买英伟达顶尖芯片的用户。
中国模型+中国芯片的组合可能会是更好的选择。DeepSeek之外,月之暗面也提出了跨数据中心异构硬件推理框架,让国产芯片可以介入到推理过程中。未来,AI的应用会像互联网一样从欧美、东亚普及向东南亚、非洲、拉美。这是一个巨大的机会空间。
微软在2026年1月发布的一份报告中认为,DeepSeek推动了整个发展中国家更广泛的使用AI。报告估计,DeepSeek在俄罗斯、白俄罗斯、古巴、叙利亚、伊朗、埃塞俄比亚、津巴布韦、乌干达、尼日尔等国家,都占有双位数的市场份额。「开放性和可负担性的结合使DeepSeek在西方AI产品服务不足的市场中获得了牵引力。」
回到我们开头的问题,牌桌上的力量对比目前并没有发生变化,但牌桌之下,各方的角力早已开始。并且这种角力不再像Chat阶段那样是纯粹技术能力的比拼,而是开始涉及到更多技术之外的模式、体系的竞争。这是不同量级的较量,需要更多时间准备。这也是DeepSeek、月之暗面更积极进行资本运作的原因。
当这些角力开始浮上水面时,才是行业格局真正改变的时刻。
作者 | 李威
本文由人人都是产品经理作者【窄播】,微信公众号:【窄播】,原创/授权 发布于人人都是产品经理,未经许可,禁止转载。
题图来自Unsplash,基于 CC0 协议。
- 目前还没评论,等你发挥!

起点课堂会员权益




