中国版 Sora？生数科技到底在做什么？

搜索

APP

起点课堂会员权益

职业体系课特权

线下行业大会特权

个人IP打造特权

30+门专项技能课

1300+专题课程

12场职场软技能直播

12场求职辅导直播

12场专业技能直播

会员专属社群

荣耀标识

发布

中国版 Sora？生数科技到底在做什么？

张艾拉

2026-04-28

0 评论 967 浏览 0 收藏

14 分钟

当Sora淡出公众视野时，中国多模态视频生成赛道却跑出一匹黑马——生数科技。这家成立仅两年的公司凭借自研U-ViT架构和Vidu平台，两个月内狂揽26亿融资。从全球200多个国家的用户覆盖，到与索尼、腾讯等巨头的深度合作，生数科技正在用独特的参考生视频技术和三层商业架构，重新定义AI视频生成领域的竞争格局。

Sora 下线的同时，国内一家做多模态视频生成的公司却在两个月内连续拿了两笔共 26 亿人民币的融资。

今天就分享这家公司：生数科技。

01 生数科技是做什么的？

生数科技成立于 2023 年 3 月，核心方向是多模态大模型，当前最核心的产品是视频生成平台Vidu。

简单来说，这家公司一边做底层多模态模型，一边通过 SaaS、MaaS、App 等形态，把视频生成和多模态生成能力卖给个人创作者、专业团队和企业客户。

官网最新口径里，Vidu 的用户已经覆盖全球200 多个国家和地区，MaaS 平台服务的是互动娱乐、广告营销、动漫影视、文创文旅、智能硬件等行业里的开发团队、企业和合作伙伴。

从融资看，这家公司已经进入重投入、重扩张阶段。今年 2 月，生数完成超过 6 亿元人民币 A+ 轮融资；4 月，又完成20 亿元人民币左右的 B 轮融资，由阿里云领投。

02 核心团队及特点

生数最核心的技术人物是朱军，是公司的创始人兼首席科学家。

朱军本身是清华大学计算机系教授、清华大学人工智能研究院副院长，长期做机器学习、生成模型和扩散模型方向。

公司早期创始班底还有唐家渝和鲍凡：唐家渝本硕都在清华计算机系，做过腾讯优图、瑞莱智慧；鲍凡是清华计算机系博士，长期跟着朱军做扩散模型和多模态生成。

2025 年 3 月，原火山引擎 AI 业务负责人骆怡航加入生数出任 CEO，负责研发、产品、商业化和团队管理。

这个团队组合很有代表性。

朱军和鲍凡代表的是模型原创能力，唐家渝代表的是产品和产业衔接，骆怡航补上的是商业化、组织和全球拓展。

换句话说，生数不是“高校老师带学生创业”的轻团队，它已经把科研、产品化和商业化三层都拼好了。

尤其是 CEO 骆怡航加入后，外界对它的判断也明显从“技术明星项目”转向“准备大规模商业化的视频模型公司”。

03 核心技术和产品

生数不是靠套开源模型起来的。它反复强调的技术底座叫U-ViT。

这个架构最早在 2022 年 9 月由朱军团队提出，是扩散模型和 Transformer 融合的一套自研路线。

2023 年，团队又基于这个架构做了 UniDiffuser。2024 年核心产品 Vidu发布时，外界都把它看作这条技术路线在视频生成上的一次产业化落地。

它在技术上的打法是：先有模型，再有产品。所以你会看到它既在推 Vidu，也在往“世界模型”方向延展。

生数把自己的技术架构讲成三层：底层是基础世界模型，上面分成数字世界的生成模型和物理世界的行动模型。

这个方向还比较早，但至少说明它的自我定位，不只是做一个创意工具，而是想把视频模型继续往更通用的建模能力上推。

04 核心产品 Vidu 到底是什么。

如果只看用户端，Vidu 现在已经是一个比较完整的创作平台了。官网列出来的主功能包括：参考生视频、图生视频、文生视频、AI 音效、AI 生图、Vidu Q3、模板、API 开放平台。

也就是说，它不是单一的视频生成工具，而是一整套内容生产入口。

再往下拆，Vidu 现在至少有三层产品形态。

第一层是面向创作者的 SaaS 平台。

用户直接在 Vidu 网站或 App 上用文生视频、图生视频、参考生视频等功能做内容。

适合独立创作者和团队，重点场景是动态视频、二维动画、多种艺术风格内容。

第二层是面向开发者和企业的 MaaS / API。

Vidu 的开放平台是给企业和开发者“无缝创建并规模化扩展视频驱动产品”的平台。

它支持视频生成、图像生成、音频生成和其他工作流组件，已经是一套企业可接入的能力层。

第三层是行业合作与解决方案。

官网的合作页列了很多生态伙伴：百度智能云、AWS、华为云、视觉中国等。

也就是说，Vidu 在往云平台、视觉内容、文化产业、端侧硬件、XR等不同场景拓展。

05 核心产品 Vidu 具体有哪些能力

Vidu 的核心能力包括参考生视频、图生视频、文生视频。

其中参考生视频被官网直接称为全球首个参考生视频功能，主打角色、物体、场景的一致性。

先来看参考生视频。

普通文生视频主要靠文字描述，因此人物长相、衣服、物体样子、场景细节容易前后不稳定。

参考生视频是先给模型一张或几张参考图，再让它按这些图里的角色、物体、场景去生成视频。核心价值就是保持一致性和内容创作的连续性。

参考生视频是 Vidu 最有辨识度的功能之一。这个能力支持1 到 7 个主体、合计 1 到 7 张图片输入，还能在“参考生音视频”模式下，给参考图中的主体指定对白，直接生成带音频的视频。

模型层面，不同版本的产品能力区分得也很清楚：Q2 动态更强、细节更丰富；Q1 画面更清晰、过渡更平滑、运镜更稳定；2.0 的特点是速度快。

接下来是图生视频。

图生视频的逻辑更直接，就是把静态图变成动态视频。

用户可以从任意图片出发，把想象中的动态画面生成出来；图生视频支持自定义首尾帧，用来优化流畅度。

对创作者来说，这种能力的价值很实在：海报、产品图、插画、人物图，不用重新拍摄或建模，就能直接转成短视频素材。

最后是文生视频。

文生视频是视频模型的基础能力，但 Vidu 不是只停在“把文字变成一段画面”。

它比较强调镜头运动设计、语义理解和电影感输出。2024 年 Vidu 刚发布时，公开资料就提到它支持一键生成最长 16 秒、1080p 的高清内容，并在多镜头语言、时空一致性、动态表现上去对标 Sora。

除了视频生成外，还有音视频一体生成。

Vidu 支持音频和画面同步输出，而且不是只加一个背景音轨，而是对话、旁白、音效、音乐四类音轨可以一次生成；单次最长支持16 秒。

适用场景写得也很清楚：漫剧、漫画风剧情、电影感镜头、短剧、叙事广告。

最后，速度是生数一直在打的点。

官方报道，Vidu 2.0 在图生视频和首尾帧生视频上，生成 4 秒 512P 单片段视频都已做到10 秒以内；单片段视频实测推理速度已经压到30 秒以内。

06 商业模式和市场表现

生数的商业模式其实前面已经说的比较清楚，主要分三块。

第一块是创作者订阅。

Vidu 官网有订阅页和免费积分机制，所有用户可以先拿免费积分体验，再根据需要订阅。

第二块是API 调用收费。

这一块是它最标准的 MaaS 模式。开发者或企业通过开放平台，按模型、分辨率、时长来计费。不同模型和分辨率的价格不同。

第三块是企业项目与行业合作。

生数并不是单纯卖标准 API，它还在做联合解决方案、生态接入和行业项目。

视觉中国和它一起做视觉产业大模型平台，AMD帮它往端侧和 AI PC 部署扩展，百度千帆帮它扩大企业调用场景。

这类合作通常意味着更高客单价和更深绑定。

07 再来看市场表现和增长数据。

第一组是早期爆发力。

官网报告，Vidu 从 2024 年 7 月底全球上线后，20 天用户数破百万，100 天破千万，累计生成视频过亿条。

参考生视频这个功能上线 3 个月后，用户用它生成的视频也已经到千万条级别。

第二组是2025 年全年增长。

Vidu 在 2025 年实现了用户和收入都超过 10 倍增长。行业客户包括索尼电影、腾讯动漫、字节跳动等。

第三组是全球覆盖和行业渗透。

官网写的是 200 多个国家和地区；MaaS 服务的是全球数千家开发团队、企业和伙伴；合作方已经横跨云平台、内容平台、影视动画、文旅、智能硬件、艺术数据库等多个行业。

08 核心竞争力和风险分析

生数现在的竞争力，主要有三个。

第一，它的技术栈是自己的。U-ViT 这条路线、UniDiffuser 这类研究积累，让它不是靠套壳起家。这会直接影响模型迭代速度和长期天花板。

第二，产品方向很实用。Vidu 围绕一致性、速度、成本、成片能力四件事作为核心卖点，这些都是专业创作者和企业最在意的点。

第三，C 端、B 端和生态合作同时铺开。很多公司只在网页端卷创作者，或者只在 API 卖模型。生数现在是三条线一起走：创作者订阅、开发者 API、企业合作。这个结构更容易放大收入。

同时，这家公司也面对无法回避的现实压力。

一是视频模型赛道迭代太快，阿里、字节、快手、可灵、Runway、Google、xAI 都在卷，模型领先窗口往往很短。

二是它现在很多案例仍然是“官方案例”或“匿名客户案例”，这说明公司已经有商业化，但对外能验证的客户细节还不算特别多。判断它未来的稳固程度，还要继续看更多长期付费客户、续费率和大客户占比。

三是它往世界模型走，想象空间更大，研发和算力投入也会更重。今年以来的连续大额融资本身既说明市场看好，也说明这门生意依然非常烧钱。

以上，祝你今天开心。

作者：张艾拉公众号：Fun AI Everyday

本文由 @张艾拉原创发布于人人都是产品经理。未经作者许可，禁止转载

题图来自作者提供

更多精彩内容，请关注人人都是产品经理微信公众号或下载App

张艾拉

公众号「 Fun AI Everyday」& AI 出海App「爱卜」

162篇作品 309104总阅读量

如何赢得「创业市场」？

01-174065 浏览

喜茶与FENDI联名款朋友圈刷屏，爆火靠的是“高级感”？

05-187025 浏览

【创作者专题】创作者概述

01-107521 浏览

小红书投流钱花不出去？所属类目可合作的博主特别少？如何解决这2大问题！

10-104228 浏览

抖音的“偏殿菩萨”们

03-313171 浏览

目前还没评论，等你发挥！

“西方甄选”火速被封！山寨主播为何层出不穷？

12-212859 浏览
新发现！小红书排行榜笔记正入侵各大品类

11-033340 浏览
产品经理大会心得 | 无序的业务思考，有序的业务建模

09-182532 浏览