Marble:李飞飞推出首个商业化产品,加速世界模型竞争

0 评论 356 浏览 0 收藏 9 分钟

这篇文章带你全面了解 Marble 的核心功能、商业化路径与应用前景,揭秘这款产品如何推动世界模型从技术探索走向实用落地,重塑 3D 创作与智能交互的未来。

如果说大语言模型教会机器读写,李飞飞希望Marble这类产品能教会机器观察和创造。

11月13日,AI教母、斯坦福大学教授李飞飞的创业公司 World Labs 正式发布了首款产品 Marble,由其世界模型提供支持。

该产品现已推出免费增值版和付费版,用户可通过文本提示词、照片、视频、3D 布局或全景图,生成可编辑、可下载的 3D 世界。

这款生成式世界模型两个月前已开启限量测试版,此次正式上线距离 World Labs 秘密融资 2.3 亿美元仅一年多时间。

世界模型是一种能生成环境内部表征的 AI 系统,可用于预测未来结果和规划行动。

竞争对手层面看,Decart、Odyssey 等初创公司已发布免费演示版,而 Google 的 Genie 仍处于限量研究内测阶段。

Marble 与上述产品(甚至包括 World Labs 自家的实时模型 RTFM)的不同之处在于,它能创建持久化、可下载的 3D 环境,而非在用户探索过程中实时生成世界。

该公司表示,这一特性减少了场景变形或不一致的问题,用户还可将生成的世界以 Gaussian splats、网格或视频格式导出。

此外,Marble 也是同类产品中首款提供原生 AI 编辑工具和混合 3D 编辑器的模型。用户可先搭建空间结构框架,再由 AI 填充视觉细节。

去年 12 月,World Labs 曾展示了早期模型仅通过单张图片就能生成交互式 3D 场景。尽管当时效果令人印象深刻,但这些略带卡通风格的场景并非完全可探索——移动范围受限、偶尔会出现渲染错误。

而今,在测试版体验中,我们发现 Marble 仅通过图像提示词就能生成高质量世界,既有游戏风格的环境,也有与现实环境高度逼真的复刻版本。当时场景边缘存在轻微变形问题,在此次正式版本中已得到改善。

我们尚未测试其编辑功能。但官方表示,这些功能让 Marble 能切实应用于游戏、视觉特效(VFX)和虚拟现实(VR)项目。

官方表示,“Marble 未来的核心方向之一是创意控制权,用户应当能快速生成内容,同时也能深入细节,对生成的内容拥有高度掌控权。不能让机器完全主导,剥夺用户的创意空间”。

Marble 对创意控制权的实现,首先体现在输入灵活性上。测试版仅支持单张图片输入,模型需自行构想 360 度视角中未显示的场景;而正式版上线后,用户可上传多张图片或短视频,从不同角度展示空间,模型将据此生成高度逼真的数字孪生体。

其次是实验性 3D 编辑器 Chisel,用户可先用它搭建粗略的空间布局(如墙壁、立方体或平面),再添加文本提示词引导视觉风格。Marble 会基于此生成世界,实现结构与风格的分离。这类似于 HTML 负责网站结构、CSS 负责色彩搭配的模式。而且,与文本编辑不同,Chisel 允许用户直接操控物体。

另一项提升编辑控制权的新功能是世界扩展。

生成世界后,用户可进行一次扩展操作。当你移动到世界中开始出现断裂的区域时,可指令模型在该位置或当前周边区域扩展、生成更多内容,进而补充该区域的细节。

若需创建超大空间,用户可通过 “合成器模式”(composer mode)将多个世界组合起来。

Marble 目前提供了四种订阅套餐:

  1. 免费版(Free):支持通过文本、图片或全景图生成 4 个世界;
  2. 标准版(Standard):每月 20 美元,可生成 12 个世界,支持多图 / 视频输入及高级编辑功能;
  3. 专业版(Pro):每月 35 美元,可生成 25 个世界,包含场景扩展功能及商业使用权;
  4. 旗舰版(Max):每月 95 美元,解锁全部功能,可生成 75 个世界。

游戏开发者对 Marble 的态度褒贬不一。

近期游戏开发者大会(Game Developers Conference)的调查显示,三分之一的受访者认为生成式 AI 对游戏行业存在负面影响,这一比例较去年上升了 12%。

知识产权盗窃、能源消耗、AI 生成内容质量下降、游戏工作室利用 AI 偷工减料/减少成本,是最受关注的四大问题。

对此,官方解释道,开发者可借助 Marble 生成背景环境和氛围场景,再将这些导入 Unity 或 Unreal Engine 等游戏引擎,添加交互元素、逻辑和代码。Marble 并非旨在取代游戏行业现有的完整流程,而是为该流程提供可直接接入的场景。

在视觉特效领域,官方表示,Marble 解决了 AI 视频生成器普遍存在的一致性差和相机控制不佳的问题。其 3D 技术能让创作者自由搭建场景,并以帧级精度控制相机运动。

尽管 World Labs 目前暂未专注于虚拟现实(VR),但他们认为 VR 行业极度缺乏内容,并且对 Marble 的表现充满期待。

Marble 现已兼容 Vision Pro 和 Quest 3 VR 头显设备,所有生成的世界均可立即在 VR 设备中查看。

在机器人领域,Marble 也可能具备应用潜力。官方指出,与图像和视频生成不同,机器人领域缺乏庞大的训练数据资源。但借助 Marble 这类生成器,将能更便捷地模拟训练环境。

World Labs 首席执行官兼联合创始人李飞飞在近期的一份宣言中表示,Marble 是迈向 “真正具备空间智能的世界模型” 的第一步。

李飞飞认为:

“下一代世界模型将使机器在空间智能方面达到全新高度”;

如果说大型语言模型(LLM)教会机器读写,李飞飞希望 Marble 这类产品能教会机器观察和创造;

世界模型理解物体在三维空间中的存在形式和交互方式,最终将帮助机器在游戏和机器人之外实现突破,甚至涉足科学和医学领域。没有空间智能,我们打造真正智能机器的梦想就无法实现。(TC)

本文由人人都是产品经理作者【AI新智能】,微信公众号:【AIOrbit】,原创/授权 发布于人人都是产品经理,未经许可,禁止转载。

题图来自Unsplash,基于 CC0 协议。

更多精彩内容,请关注人人都是产品经理微信公众号或下载App
评论
评论请登录
  1. 目前还没评论,等你发挥!