DeepSeek给大家留出了准备空间

搜索

APP

起点课堂会员权益

职业体系课特权

线下行业大会特权

个人IP打造特权

30+门专项技能课

1300+专题课程

12场职场软技能直播

12场求职辅导直播

12场专业技能直播

会员专属社群

荣耀标识

发布

窄播

2026-04-28

0 评论 390 浏览 0 收藏

12 分钟

DeepSeek V4落地后没掀桌，对阿里、腾讯、月暗都是好消息。这一轮发布全是“Preview”预览版，没人敢喊是真正的新一代。关键变量在两个地方：谁能率先做出更适配Agent范式的突破，谁能把性价比打到更低。国产模型用便宜价格达到闭源模型90%性能的机会空间正在打开。

这是《窄播Weekly》的第88期，本周我们关注的商业动态是：大模型的发布。过去10天，大模型新品密集发布，看似竞争激烈，但各方的力量对比却并未有大的改变，整个行业都还处于一种过渡状态。

4月24日，DeepSeek V4发布成为这轮大模型密集上新的压轴戏。在此之前，OpenAI和腾讯在4月23日分别推出了GPT 5.5和Hy3 preview，月之暗面和阿里分别在4月20日发布了Kimi K2.6和Qwen3.6-Max-Preview，Anthropic则在4月16日发布了新模型Claude Opus 4.7。

大家期盼已久的DeepSeek V4，并没有像当初R1发布时那样带来颠覆性的技术突破。反倒是它对国产芯片的适配能力，成了新模型发布后的第一讨论落点。甚至，这两天还冒出了一种「国产模型默契同行」的积极论调。

但我们更关心的，是DeepSeek V4落地之后，牌桌上的力量对比究竟变了多少。

首先，DeepSeek这次没掀桌，对阿里、腾讯、月之暗面、MiniMax、智谱来说，都算是个好消息。阿里、腾讯此前刚经历大模型团队调整，这下多了些恢复时间；月之暗面也没被DeepSeek彻底封死估值空间；MiniMax、智谱还能继续吃上龙虾热带来的收入增长。

其次，格局变化不大的根本原因在于：这一轮发布的模型大多还处于过渡状态，没有掀桌的势能。各家一边发新模型，一边预告更强模型或更高性价比——龙虾才刚亮出潜力，由大模型驱动的Agent竞赛，远没到最激烈的时候。

关键的变量，会出现在两个地方：一是谁能率先做出更适配Agent范式的研究突破，二是谁能把性价比打到更低。

01 过渡阶段的产物

这一轮发布有个明显特征：「Preview」（预览版）成了高频词，没人敢喊这是「真正的新一代大模型」。除了都需要更长时间来应对Agent爆发这个技术刚需，各个企业自身也都需要做更多准备来迎接真正激烈的竞争。

第三方机构SemiAnalysis认为DeepSeek V4是「一个特殊的工程版本」，「紧随前沿水平之后」，可以作为美国闭源大模型的低成本替代品。但要真正延续极致性价比，DeepSeek还需要等待国产芯片超节点批量上市，为其提供充足的高端算力保障，将Pro版模型的API价格打下来。

月之暗面虽然表示Kimi K2.6是目前最好的代码模型，但也提到了K2.6是为K3准备的起飞跑道。从数据上看，Kimi K2.6是一个万亿参数的MoE多模态模型，32B激活参数，256K上下文。相比之下，Gemini、Qwen和DeepSeek都已经开始支持百万级的超长上下文。

腾讯的Hy3 preview总参数295B，激活参数21B，最大支持256K上下文长度。腾讯首席AI科学家姚顺雨将其称为混元大模型重建的第一步，期望「获得来自开源社区和用户的真实反馈，帮助提升Hy3正式版的实用性。」也就是说，雷峰网消息报道的将在五六月份发布的Hy3闭源旗舰版本，可能才是姚顺雨真正要交的卷。

阿里的Qwen3.6-Max-Preview也被描述成新一代千问旗舰模型的早期预览版，还在积极开发，持续迭代。阿里在林俊旸风波之后获得广泛关注的视频模型HappyHorse与世界模型HappyOyster，都出自刚被划归ATH事业群的原淘天集团未来生活实验室，而经历大变动的基础模型团队还没有拿出能证明自己的模型。

在海外，Anthropic在Claude Opus 4.7之外，还有一个据说很强的Mythos；GPT 5.5也没有被行业看作是一个划时代的产品。

02 服务Agent是新阶段的核心

小米大模型团队负责人罗福莉一直在强调，大模型技术正处于从Chat到Agent范式的快速转变过程中。小米此前发布的旗舰基座模型Xiaomi MiMo-V2-Pro，以及全模态基座模型Xiaomi MiMo-V2-Omni和语音合成模型Xiaomi MiMo-V2-TTS，被她称作是为Agent时代打造的首个全栈模型家族。

在DeepSeek和月之暗面发布的信息中，也都在强调新模型对Agent能力的强化。DeepSeek V4针对Claude Code、OpenClaw、OpenCode、CodeBuddy等主流Agent产品进行了专项适配和优化。Kimi K2.6引入Agent集群架构，支持300个子Agent并行协作。

这些技术也在DeepSeek和月之暗面的工作中得到了检验。DeepSeek内部员工已经把DeepSeek V4 Pro当作日常Agentic Coding工具使用，交付质量接近Claude Opus 4.6非思考模式。月之暗面的RL基础设施团队用Kimi K2.6驱动的Agent在负责监控、故障响应和系统运维，能连续运行5天。

未来的模型竞争是围绕服务Agent进行的。相比Chat阶段，强调真正交付结果的Agent阶段，会让好模型的价值迅速膨胀。

这种膨胀目前已经体现在大模型公司的收入增长上。智谱经历了多次涨价，但市场需求依然供不应求，调用量增长了400%。Kimi K2.5上线20天的收入已经超过了月之暗面2025年的全年收入。Anthropic的ARR（年度经常性收入）也来到了300亿美元。这种增长也推高了大模型公司的市值或估值。

罗福莉在接受张小珺访谈时表示，接下来两三个月会非常精彩。她认为，在Agent范式阶段，大家都处在同一起跑线上。接下来，团队的研究水平、技术敏捷度，以及拥抱新范式的能力，将决定谁能跑出来——现在怎么决策，很可能就决定了半年后哪个模型更领先。

03 性价比会带来更大空间

从大的竞争层面来看，美国的闭源模型依然处于领先地位，DeepSeek、月之暗面的比较对象，都不是OpenAI和Anthropic的最新模型。但中美大模型之间也并未拉开断层式的差距。这就让中国大模型有可能用性价比争取更大的发展空间——用很便宜的价格达到美国闭源大模型90%的性能。

目前，DeepSeek新一代模型的最贵价格是每百万token输入价格12元（缓存命中1元），输出价格24元；Kimi K2.6的价格是每百万token输入价格6.5元（缓存命中1.1元），输出价格27元。即便较前代模型有所上涨，也仍然远低于GPT-5.5的每百万token输出30美元的定价。而且，这种价格优势还有可能在国产芯片的加持下被进一步放大。

对于有充足资源使用欧美顶尖闭源模型的用户而言，他们需要衡量模型的API价格与其所能替代的生产力价值。

这就像C端用户购买大模型产品的会员，不是花钱越多、性能越高，就越适合自己。最高档位往往对应最强的功能，但大部分人都用不到这么强的功能。同样，欧美用户在购买模型API时，更多会考虑性价比。这就是中国大模型正在获取的机会空间。

还有一个机会场景是没能力使用欧美顶尖闭源模型，甚至也没能力购买英伟达顶尖芯片的用户。

中国模型+中国芯片的组合可能会是更好的选择。DeepSeek之外，月之暗面也提出了跨数据中心异构硬件推理框架，让国产芯片可以介入到推理过程中。未来，AI的应用会像互联网一样从欧美、东亚普及向东南亚、非洲、拉美。这是一个巨大的机会空间。

微软在2026年1月发布的一份报告中认为，DeepSeek推动了整个发展中国家更广泛的使用AI。报告估计，DeepSeek在俄罗斯、白俄罗斯、古巴、叙利亚、伊朗、埃塞俄比亚、津巴布韦、乌干达、尼日尔等国家，都占有双位数的市场份额。「开放性和可负担性的结合使DeepSeek在西方AI产品服务不足的市场中获得了牵引力。」

回到我们开头的问题，牌桌上的力量对比目前并没有发生变化，但牌桌之下，各方的角力早已开始。并且这种角力不再像Chat阶段那样是纯粹技术能力的比拼，而是开始涉及到更多技术之外的模式、体系的竞争。这是不同量级的较量，需要更多时间准备。这也是DeepSeek、月之暗面更积极进行资本运作的原因。

当这些角力开始浮上水面时，才是行业格局真正改变的时刻。

作者 | 李威

本文由人人都是产品经理作者【窄播】，微信公众号：【窄播】，原创/授权发布于人人都是产品经理，未经许可，禁止转载。

题图来自Unsplash，基于 CC0 协议。

更多精彩内容，请关注人人都是产品经理微信公众号或下载App