VAST:29岁游戏玩家,怎么把 AI 3D 做成 10 亿美元公司
在AI大模型与视频生成赛道陷入内卷的今天,VAST AI选择了一条更具挑战性的道路——AI 3D。这家创立仅一年的初创公司凭借Tripo Studio这款「生产力级」3D生成工具,不仅拿下10亿美元估值,更在游戏、影视、工业设计等领域掀起革命。本文将深入解析其从单点工具到世界模型的战略跃迁,以及AI 3D如何重构数字内容的生产逻辑。

今天分享的是国内的一家初创公司:VAST AI,https://vast.ai/
过去两年,国内 AI 创业公司最拥挤的方向莫过于大语言模型、AI 搜索、AI 视频、AI Agent。
今天分享的 VAST 却选择了一条相对窄、也更困难的方向:AI 3D。
VAST成立于 2023 年,创始人宋亚宸,1997 年出生。
海外媒体报道里,他被写成一个 29 岁的游戏玩家:曾在约翰霍普金斯大学读国际研究,也曾连续多日沉迷《文明》这类策略游戏。
创立VAST前,宋亚宸参与过MiniMax的早期创立,也在商汤推动过 AI 项目落地。
VAST 的方向,来自他对游戏、动画和 3D 内容的长期兴趣。

2026 年 6 月,VAST AI 完成 A+ 和 A++ 两轮融资,合计接近 2 亿美元,估值超过 10 亿美元,成为中国新一批 AI 独角兽之一。
01 不是生成一张 3D 效果图
VAST 的核心产品叫Tripo Studio。
按照官网介绍,Tripo 可以把文字、图片或草图生成“可用于生产的 3D 资产”,并且支持 3D 分割、AI 贴图、自动绑定、模型风格化、Smart Mesh、高精度模型等功能。

也就是说,它不是一个简单的“图生 3D 玩具”。
在 2D 图像生成里,用户只要得到一张好看的图片,任务基本就结束了。
但 3D 不一样,3D 模型要进入游戏、动画、影视、3D 打印、工业设计,后面还要经过拓扑、贴图、分件、绑定、动画、格式转换、引擎适配等一系列步骤。
所以,AI 3D 的商业价值不取决于“看起来像不像”,而取决于生成结果能不能继续被编辑、被导出、被放进真实工作流程里。
Tripo 的产品设计正是围绕这个问题展开。
它支持多视角图生 3D、图生模型、文生模型、动画、风格生成、后处理、面数控制、Mesh 转换、格式转换等能力。
官网列出的场景包括游戏、动画、影视、3D 打印、玩具、硬件、工业、建筑、家居设计、电商、广告、VR / AR 等。
02 已经有用户和收入,不是纯概念公司
VAST 的商业化数据来自不同媒体和公司披露,口径略有差异,但能看到一个增长轨迹。
2026 年 3 月,VAST 完成5000 万美元 A 轮融资,由阿里和上汽领投;当时 Tripo Studio 已经累计超过650 万用户,服务 9 万多开发者及企业。
到 2026 年 6 月,Tripo Studio 已有约2000 万用户,大部分来自美国,其次是欧洲、日本和韩国;其订阅价格从每月 20 美元起,此外还按 token 消耗收费。
价格方面,官网价格页显示,Tripo Studio 有免费版和付费版。
免费版每月 200 credits,最多可生成 8 个模型。
Pro 版按年折算约 13.93 美元/月;Max 版按年折算约 53.94 美元/月。
Pro 版开始提供私有模型、商业使用、多视角生成、批量生成、Smart Mesh、高质量 Mesh 等功能。
这组价格设计很清楚:
VAST 不是单纯靠免费流量做社区,而是在用“免费试用 + 创作者订阅 + 团队版 + API”去承接不同层级的用户。

普通用户可以把它当成一个 3D 生成器;
独立创作者可以用它做模型、手办、游戏素材;
中小团队可以把它接进现有流程;
更大的游戏、影视或工业客户,则需要 API、团队空间、私有资产、商业授权和更高质量模型。
03 为什么是游戏和 3D
创始人宋亚宸的背景前面介绍过,分别在商汤和 MinMax 的经历。
VAST 的CTO 梁鼎是清华本硕博,曾任商汤通用模型负责人。
首席科学家曹炎培也是清华计算机系本博,曾参与 threestudio、TripoSR 等 3D 生成相关项目,后来任腾讯 ARC 实验室和 AI Lab 专家研究员。
VAST 的判断是,AI 不应该只生成文字、图片和视频,还应该生成可以交互、可以编辑、可以复用的空间内容。
文字是对世界的抽象表达,图片和视频是对世界的压缩表达,3D 则更接近现实世界本身。
对于游戏、动画、机器人、仿真、数字孪生、工业设计来说,3D 不是装饰,而是基础格式。

这也是为什么 VAST 没有把自己定位成一个“AI 3D 工具”,而是反复强调“AI 3D 基础模型”和“世界模型”。
公司也将 Tripo AI 定义为一家建设 AI 3D 基础模型和世界模型的公司,目标是让用户可以创建、编辑、体验和交互 3D 内容与持久化世界。
04 VAST 的第一步,是“造万物”
如果把 VAST 的路线拆开,第一步是“造万物”:用 AI 生成单个 3D 资产。
这一步看似简单,实际上非常难。
传统 3D 生产需要建模师先做形体,再做拓扑、UV、贴图、材质、绑定、动画,最后导入游戏引擎或设计软件。
复杂角色、机械结构、场景物件都需要大量人工时间。
AI 要替代一部分流程,不能只给出一个粗糙外形,还要让模型具备清晰几何结构、合理拓扑、可控面数、材质和贴图质量。
VAST 在这一层投入了大量模型和工具能力。
从产品角度看,Tripo 不是单点能力,而是逐渐往 3D 工作台发展:
生成、贴图、分件、绑定、动画、格式输出、插件接入,尽量覆盖一个 3D 资产从想法到可用的中间流程。
05 第二步,是把工具做成创作者生态
单个工具可以提高效率,但平台才可能形成网络效应。
VAST 的第二步,是围绕 Tripo 做创作者生态。
它的产品矩阵包括:Tripo Studio、Tripo Game Hub、Tripo API。
同时还有开发者文档、博客、教程、3D 打印、游戏开发、媒体制作、室内设计、电商、教育等内容入口。
Tripo API 则面向开发者和企业。
官方介绍称,API 可以把文字、单张图片、多视角图片转成 3D 模型,也支持动画、风格生成、后处理、面数控制、格式转换等能力。
这说明 VAST 不只想让用户在网页里生成模型,还想把 AI 3D 嵌入其他产品和工作流。
比如,一个游戏团队可以把 Tripo 接进早期美术原型流程;
一个 3D 打印平台可以把它变成用户生成模型的入口;
一个电商平台可以把商品图转成 3D 展示素材;
一个儿童创作或玩具平台,可以让用户从草图生成手办、钥匙扣、积木模型。

从商业化看,这比单纯做 C 端 App 更稳妥。
因为专业创作者和企业用户更清楚自己为什么付费:他们买的不是“新鲜感”,而是节省建模时间、降低原型成本、提升内容产能。
06 为什么 VAST 也在讲世界模型
2026 年 6 月,VAST 在融资消息之外,还正式披露了Project Eden。
Project Eden 是 VAST 从“造万物”走向“造世界”的关键项目。
官方解释说,语言模型预测下一个词,视频模型渲染下一帧,而世界模型需要进一步维护和更新环境状态,让世界能随着用户行为、智能体行为和时间变化持续演化。

Project Eden 的核心设计,是把“世界状态”和“视觉渲染”拆开。
第一层是结构化状态层,维护底层 3D 世界状态,包括场景几何、物体身份、属性和事件逻辑。这个世界状态独立于任何一个镜头视角存在。
第二层是状态到观察的接口,把底层世界状态转成不同视角下的语义和几何约束。这样,不同视角看到的画面都来自同一个底层世界,而不是各自临时生成。
第三层是生成式渲染层,根据状态约束生成视觉输出,用于沉浸式和交互式体验。
这个架构要解决三个问题:
环境长期存在,世界可以被编辑和复用,多人和 AI 智能体可以同时进入同一个世界互动。
这和普通视频生成很不一样。
视频生成模型可以生成一个看起来连续的画面,但它不一定真的知道镜头外的物体还在不在,也不一定能保证用户转身、离开、回来之后,世界状态仍然一致。
VAST 想解决的就是这个问题:
不是生成一段视频,而是生成一个能被进入、被修改、被再次访问的 3D 世界。
07 这条路为什么有吸引力
AI 3D 和世界模型的想象力,不只在游戏。
游戏是最直接的应用场景,因为游戏本来就是 3D 资产、规则系统、交互体验的集合。
但 3D 世界模型的潜在场景还包括影视预演、动画制作、虚拟拍摄、VR / AR、建筑设计、数字孪生、机器人仿真、多智能体训练等。
VAST 把 Project Eden 定位为下一代互动内容创作的基础引擎,同时可作为具身智能研究、多智能体评估和交互式世界生成的仿真基础。
在这个行业方向上,VAST 并不孤立。
腾讯已经推出混元 3D 相关工具。
腾讯官方在 2025 年宣布 Hunyuan 3D creation engine 全球发布,支持文字、图片、草图等多模态输入生成 3D 资产,目标也是把传统几天甚至几周的 3D 生产缩短到几分钟。
李飞飞创立的 World Labs也在做空间智能和世界生成。
World Labs 的 Marble 可以从文字、图片、视频或 360 全景生成空间一致、高保真、可持久存在的 3D 世界,并支持编辑、扩展和组合世界。
08 还没有到可以下结论的时候
VAST 现在有几个优势:
融资速度快、技术团队强、产品已经商业化、海外用户占比高,也踩中了 AI 3D 和世界模型两个方向。
但它的难点也很明确。
第一,AI 3D 的专业可用性仍然是硬门槛。
对于游戏和影视公司来说,模型能生成只是第一步,真正进入生产线还要看拓扑是否干净、贴图是否稳定、绑定是否可用、动画是否自然、格式是否兼容、版权是否清楚。
VSAT 的官网和新闻稿已经展示了很多能力,但最终要看大规模客户的真实使用深度。
第二,世界模型还处在早期。
VAST 自己也承认,Project Eden 仍在推进复杂场景模拟、物理动态、自由视角探索、对象级交互、实时渲染性能和状态转移模型等问题。
第三,竞争会越来越激烈。
腾讯、World Labs、Meshy 等公司都在做 3D 生成或世界生成。VAST 正在与腾讯混元 3D、硅谷创业公司 Meshy 等公司竞争,而游戏行业虽然规模巨大,但对 AI 3D 的商业化仍然谨慎。
第四,10 亿美元估值对一家 2023 年成立的公司来说并不低。
因此 VAST 需要继续证明:用户数增长可以转化为稳定收入,创作者工具可以沉淀生态,企业客户愿意长期接入,世界模型不只是技术叙事,而能变成可用产品。
09 VAST 的核心问题:3D 会不会成为新的内容入口
VAST 的长期假设很清楚:未来内容不只会停留在文字、图片和视频,还会进入 3D 和交互。
这个判断如果成立,今天的 3D 生成工具,就有点像早期的图像生成工具、视频生成工具,先服务专业和半专业用户,再逐渐外溢到普通用户。
一个普通人未来可能不只是发一张图、一条短视频,而是生成一个小场景、一个可互动角色、一个可以被别人进入和修改的虚拟空间。
一个游戏团队也可能不再从零开始建模,而是先用 AI 生成大量资产和原型,再由专业人员筛选、修改、优化。
这就是 VAST 讲 UGC 交互内容平台的原因。
创始人宋亚宸的判断是,未来用户可以创作和浏览可互动的 3D 内容,并在社区中分享传播,类似 3D 版短视频平台。
这个方向能不能跑出来,现在还不能判断。
但它解释了 VAST 为什么从 3D 模型生成一路走到世界模型:
如果目标只是做效率工具,Tripo Studio 已经足够。
如果目标是做下一代互动内容入口,单个模型还不够,它最终需要一个能持续存在、可编辑、可多人进入的世界。
以上,祝你今天开心。
作者:张艾拉 公众号:Fun AI Everyday
本文由 @张艾拉 原创发布于人人都是产品经理。未经作者许可,禁止转载
题图来自作者提供
- 目前还没评论,等你发挥!

起点课堂会员权益



