阶跃星辰深度拆解:产品、技术、客户与它真正的护城河
阶跃星辰正以独特的战略路径在大模型领域崭露头角。这家成立仅一年的公司,不盲目追求参数竞赛,而是聚焦多模态能力与终端落地,将模型效率与成本控制提升到产品级高度。从Step系列模型的快速迭代,到嵌入式终端布局与行业场景深耕,本文深度解析这家AI新贵如何用工程化思维重构大模型竞争规则。

我之前在写上海 AI 六小龙的文章里,提到过阶跃星辰,但是没有详细分析。最近在了解这家公司,于是把一些信息也整理出来分享给大家。
01 公司概览:短时间内被市场认可的原因
过去两年,大模型行业最容易陷入一种错觉:谁的参数更大、榜单更高,谁就赢了。
但竞争的重心在悄悄改变。越来越多公司开始发现,决定生死的不是有没有模型,而是模型能不能被大规模用起来:能不能跑得稳、成本能不能压下来、能不能进终端、能不能进入真实业务流程。
阶跃星辰的路径,正是在这一点上更有辨识度。
它成立时间不长,却从一开始就把目标设得很清楚:围绕多模态(文字、图片、语音、视频等综合理解与生成)搭建基础模型能力,并且把落点放在终端与行业场景里,让能力真正成为产品的一部分。
阶跃星辰成立于2023年4月,总部位于上海。创始人姜大昕博士是全球著名的人工智能专家。
“阶跃”代表了大模型技术跨越式的发展,“星辰”则象征着人类对通用人工智能的最终向往。
判断一家大模型公司是不是真的在跑,在被使用,有两个指标很直观:融资结构和技术迭代节奏。
在融资上,阶跃星辰在 2024 年底完成了数亿美元 B 轮融资,投资方既有国资平台,也有市场化机构与产业资本。
公开报道普遍提到,这笔资金会继续投入基础模型研发,并强化多模态与复杂推理能力,同时扩大产品和生态覆盖。
在迭代节奏上,它的 Step 系列模型发布节奏很快:2024 年发布 Step 1 多模态 与 Step 2 混合专家结构的大模型,2025 年发布新一代基础模型 Step 3,并把推理效率与成本放到非常核心的位置。

这两件事叠加起来,基本说明:它不是靠热点包装,而是在用持续投入换取可持续的模型与系统能力。
02 产品版图:不是一个模型,而是一套可交付的能力组合
第一层:面向开发者与企业的能力底座
它把文字、图片理解、语音对话、内容生成等能力,放到开放平台上,以接口形式对外提供,方便企业直接接入业务系统或做二次开发。
第二层:面向用户的产品与合作落地
它有面向个人用户的产品跃问,官方介绍中强调智能问答、文档解析、图像理解等能力,并以自家模型作为底座。
但更关键的是,它并不把希望全押在单一应用上,而是更积极走嵌入式落地:进入手机、进入车机、进入内容与行业系统,让用户在原本的使用场景里自然用到,而不是专门再下载一个工具。
这一点,会直接影响公司的战略选择:它更关心体验链路是否完整、成本是否可控、能不能规模化交付。
03 技术路线:更偏工程与系统,不是只拼参数
如果用一句话概括阶跃星辰的技术路线,就是:以多模态为主线,把模型能力与系统工程一起做,目标是跑得动、跑得稳、跑得省。
1. 从 Step 1 到 Step 2:先把多模态底座立住
Step 1 是原生多模态方向;Step 2 则是采用混合专家结构的大模型,并强调训练效率提升与综合能力增强。
同时,Step 2万亿参数模型,也是中国最早挑战GPT-4及Gemini 1.5 Pro性能级别的国产模型之一。
这背后其实是务实的选择:多模态不是锦上添花,在手机、车机、内容理解等大量场景里,本来就是刚需。
2. Step 3:把效率摆到台前
关于 Step 3,最突出的关键词不是“更大”,而是“更快、更省”。
官方也多次强调它在推理效率上的提升,并把多模态、开源、逻辑能力、成本概括成模型面向应用需要满足的特征。
3. 开源动作:用开放换生态,扩大落地半径
在多模态方向,阶跃星辰开源了视频生成模型与语音相关模型,意图推动开发者生态。
你可以把这理解为一种策略:在行业里,仅靠闭门做模型很难快速形成被广泛采用的事实,开放能够更快把能力变成标准、变成生态。
04 客户与落地场景:聚焦终端与行业
看一家大模型公司有没有落地能力,不要只看它说服务了哪些行业,更要看它进入的场景是不是高频、是否真的嵌入流程。
1. 汽车:把语音与多模态做进座舱交互
在 2025 年世界人工智能大会期间,吉利与阶跃星辰联合展示并发布下一代智能座舱相关方案,座舱交互会结合端到端语音大模型等能力,并基于 Step 3 等模型持续升级体验。
车端是公认最难、需要长期打磨的场景之一:交互要自然、响应要快、稳定性要高、成本还得可控。
能在车端推进,往往说明工程化能力不弱。
2. 消费级产品:以嵌入式方式进手机等终端
阶跃星辰积极推进与头部终端厂商共同推进智能终端能力,如终端侧智能体、端侧生态等。
这类合作的价值在于:它不是把模型当作可选功能,而是争取进入系统级入口,成为用户每天都能用到的能力。
3. 内容与行业:用多模态提升生产效率
Step-1.5V 模型能对长视频进行深度语义分析,已经切入了视频分析、工业视觉监控等高价值商业赛道。
大模型在内容生产、资讯、垂类知识服务等方向的共同点是:需要模型既能理解复杂材料,又能把输出变成可交付内容,对稳定性和可控性要求更高。
05 核心优势:做“底座”能力的公司
把上面的信息串起来,会发现阶跃星辰的优势不在某一个点,而是一套组合拳:
第一,多模态从一开始就是主线,不是后补功能。它瞄准的正是手机、车机、内容理解这些最需要多模态的高频场景。
第二,把效率和成本当成产品能力的一部分。Step 3 强调更适合应用的模型特征,背后是对真实落地约束的正面回应。
第三,用开放与生态扩大落地半径。在视频与语音方向的开源动作,本质是在用生态换采用。
第四,终端合作是高门槛赛道。车端、终端入口意味着更长周期、更重工程、更难交付,但一旦跑通,也更不容易被轻易替换。
以上,从公司战略,到产品和技术路线,再到客户和竞争优势,这是一个相对完整的分析链路,往下走,势必就到了风险和挑战这一环了。
风险一:终端与行业落地,周期很长,现金流压力更大
越深入场景,越容易遇到组织改造、数据治理、合规流程、系统集成这些“慢变量”。这势必会拖慢规模化速度。(这里联想到了商汤)
风险二:入口在合作伙伴手里,话语权是一场持久战
能进入车机与手机只是开始,能不能持续拿到资源位,能不能证明“不可替换”,才是决定公司目前选的这条商业化路径上限的关键。
风险三:从标杆案例到可复制产品,是最大的坎
很多公司输在这里:能做出几个漂亮项目,但没有形成产品化的交付体系,最后变成“越来越像外包”,越做越重。(这里又联想到了商汤……)
也正因为这些风险存在,或许这家公司未来真正的胜负手,不是下一次模型发布,而是它能否把终端与行业的交付沉淀为可复制的产品体系。
以上,祝你今天开心。
作者:张艾拉 公众号:Fun AI Everyday
本文由 @张艾拉 原创发布于人人都是产品经理。未经作者许可,禁止转载
题图来自作者提供
- 目前还没评论,等你发挥!

起点课堂会员权益



