一句话生成一分钟视频？元宇宙的救星果然是AI

搜索

APP

起点课堂会员权益

职业体系课特权

线下行业大会特权

个人IP打造特权

30+门专项技能课

1300+专题课程

12场职场软技能直播

12场求职辅导直播

12场专业技能直播

会员专属社群

荣耀标识

发布

一句话生成一分钟视频？元宇宙的救星果然是AI

科技旋涡

2024-02-16

0 评论 2737 浏览 3 收藏

12 分钟

今天凌晨Sora模型发布后，不光是AI圈子炸了，在元宇宙相关的圈子里也引起了大范围的讨论。AI，这次真的一夜之间成为了元宇宙世界的救星。

作为一个在公众视野中起起落落的概念，元宇宙所承载的对未来虚拟世界无限的想象总让人感觉若即若离：

构建一个生动、丰富且充满互动的虚拟环境是元宇宙概念诞生起就面临的挑战，成本、技术、创意等诸多因素都在限制着元宇宙的发展。

虽然最近一年多以来AI技术突飞猛进，但在协助元宇宙虚拟世界的构建上，一直没有太大突破。

但OpenAI最新发布的视频生成模型Sora展现出了前所未有的潜力，不论是构建虚拟视频还是虚拟空间，Sora都有了巨大飞跃。

AI，这次真的一夜之间成为了元宇宙世界的救星。

一、能视频生成，就构建元宇宙场景？

对于这样一个颠覆性创新，先不做过多赘述，直接看疗效：

这段视频的提示词为：“几只巨大的猛犸象踏着白雪皑皑的草地走来，它们长长的毛毛在风中轻轻飘动，远处覆盖着白雪的树木和引人注目的雪山，午后的阳光洒满了缕缕云彩，远处的太阳发出温暖的光芒，低相机视角令人惊叹地捕捉到了大型毛茸茸的哺乳动物，并具有美丽的摄影和景深。”

这段视频的提示词为：“美丽的雪城东京很繁华。镜头穿过熙熙攘攘的城市街道，跟随几个人享受美丽的雪天并在附近的摊位购物。美丽的樱花花瓣随着雪花在风中飞舞。”

这段视频的提示词为：“动画场景的特写是一个毛茸茸的小怪物跪在一根融化的红色蜡烛旁边。艺术风格是 3D 和现实的，重点是灯光和纹理。这幅画的气氛是一种惊奇和好奇，怪物睁大眼睛、张开嘴巴凝视着火焰。它的姿势和表情传达出一种天真和俏皮的感觉，就好像它第一次探索周围的世界一样。暖色调和戏剧性灯光的使用进一步增强了图像的舒适氛围。”

几条视频展示出的AI视频能力已经很明显：

Sora能够基于文本描述准确生成高度逼真的场景，同时融入丰富的想象元素，打破了以往AI视频内容创造的限制。

首先是长时间、一镜到底的视频生成。与当前市面上的其他AI视频生成工具相比，Sora能够生成长达一分钟的视频，且在整个视频过程中保持高度的一致性和连贯性，克服了此前同类工具的最大缺陷。

同时Sora还能实现复杂场景和角色的准确描绘。在创造包含多个角色复杂场景的同时，Sora能够较为精确地描绘出动作类型、对象和背景的详细信息，甚至一定程度上实现角色的情感表达。

去年，这些问题还是AI视频内容生成领域面临的最大挑战。然而，今年开年不到两个月的时间，Sora就已经证明了自己克服这些挑战的能力。

此外，Sora还有许多令人颇感意外的亮点：

首先是其展示出了对电影拍摄语法的自发理解，能够在不同镜头之间自然过渡，推进故事的发展；同时，其对于动物毛发等细节的逼真表现，也显示出其在视频生成技术上的细致入微。

既然Sora可以生成这么多风格不同的连贯视频，那么更进一步的虚拟空间、虚拟世界构建自然也存在可能。

事实也确实如此，而且AI生成虚拟世界这一天的到来，或许会比想象中更快——正如去年的许多人也不曾预想到AI视频内容生成的发展会如此迅速一样。

二、元宇宙场景搭建不再遥远

就在发布Sora的同一时间，OpenAI发表了一篇名为《Video generation models as world simulators》（视频生成模型作为世界模拟器）的论文。

论文揭秘了有关Sora的更多关键信息，例如 Sora 可以生成任意分辨率和长宽比的视频（高达 1080p）。此外Sora 还能够执行一系列图像和视频编辑任务，从创建循环视频到及时向前或向后延伸视频，再到更改现有视频中的背景。

其中Sora的“模拟数字世界”能力对于元宇宙的发展将起到关键性作用。

目前，Sora已经能够在像《我的世界》这样的游戏中渲染世界及其动态，并控制玩家角色，在此类虚拟空间构建平台中，Sora几乎像一个数据驱动的物理引擎，而非仅仅是一个创意生成工具。

这表明，通过Sora驱动虚拟空间的全自动搭建已经在逐步成为现实。

从目前的情况来看，Sora对元宇宙的颠覆性影响主要体现在两个方面：首先，它能够直接根据需求生成虚拟视频，迅速构建元宇宙所需的场景；其次，它展现出生成可供深入探索的虚拟空间的潜力。另一方面，其有望直接生成可以深入探索的虚拟空间。

这意味着不论从技术层面、社会层面还是文化层面，元宇宙都将进入全新的发展阶段。

在技术层面，对于元宇宙的建设者来说，快速搭建丰富多样的虚拟场景变得前所未有地容易。传统上，创建逼真的虚拟环境需要大量的时间、人力和资源投入，而Sora的技术可以大大简化这一过程，使得元宇宙的扩展和多样化成为可能。

这不仅能够加速元宇宙的构建进程，还能够降低进入门槛，让更多的创作者和开发者有机会参与到元宇宙的构建中来。

同时，在未来此类技术将不仅能够生成静态的虚拟场景，还有望直接生成可深入探索的动态虚拟空间。这些空间不仅仅是视觉上的呈现，而是可以与之互动、探索和体验的完整虚拟世界。

元宇宙中的空间将不再是简单的背景或设置，而是充满了物理规则、动态事件和互动元素的生动世界。这将极大地丰富用户在元宇宙中的体验，使其不仅仅是观察者，而是能够实际参与和影响虚拟世界的发展。

社会层面，AI技术的进步将使元宇宙能够提供高度个性化的体验，根据每个用户的偏好、历史行为和社交互动来定制内容和互动。这种个性化不仅限于内容推荐，也扩展到元宇宙中的角色、环境和故事情节的定制。

同时这样的变化还会催生出新的社交互动形式，如AI驱动的虚拟角色与人类用户之间的互动，或者通过如在线演唱会、教育课程、社交聚会等虚拟活动连接全球用户。

文化层面，就像自媒体、短视频时代对传统传媒形成冲击一样，虚拟内容创作门槛的降低，无疑会进一步冲击传统影视业的发展，同时，更多个体和文化背景的人们能够创作和分享自己的故事，促进全球文化的多样性和交流。

此外，元宇宙社群的真正兴起也会带动全新的虚拟文化兴起，这种文化将完全从元宇宙中诞生、发展和传播，形成独特的文化标识和社区归属感。

三、未来已来但挑战依然

当然，在关于未来的畅想越来越具体的同时，对于AI构建元宇宙时要面临的种种问题与挑战，也到了亟待解决的时刻。

首先是技术准确性的问题，Sora在渲染复杂场景和细节（如食物的咬痕或玻璃破碎的细节）时依然存在局限。这种局限性不仅影响生成内容的真实性，也可能限制其在某些应用场景（如法医分析或科学研究）中的有效性。

此外模拟现实世界中的物理规则对于AI来说仍然是一个挑战，这反映了当前AI技术在理解和模拟复杂自然现象方面的限制。

而除了技术上的问题外，个人形象滥用对肖像权、隐私权的侵犯；现实与虚构界限的模糊，逐步侵蚀公众对信息真实性的信任；传统的安全防护和欺诈检测方难以应对更加精细和逼真的虚假内容，从而导致诈骗等案件更加频发等，都要求政府、教育机构和技术公司共同努力，提高公众对这类技术的理解和鉴别能力。

这些问题虽然已经是老生常谈，但面对技术的突飞猛进，如何更好地用规则来规范技术的发展，已经变得迫在眉睫。

该如何面对这些进步对社会、文化和伦理带来的深刻影响？如何吸取上一轮元宇宙发展的失败教训，借助AI真正营造一个开放、包容且充满多样性的虚拟世界？

这都需要元宇宙的各个相关主体负责任地探索与创新，以确保共同打造出一个既丰富又充满互动，同时安全的元宇宙，赋予其更深层的意义。

AI，这次确实成为了元宇宙的救星，但元宇宙发展中要解决的问题，却并没有减少。

作者：高乐

本文由 @元宇宙新声原创发布于人人都是产品经理。未经许可，禁止转载。

题图来自 Unsplash，基于 CC0 协议。

该文观点仅代表作者本人，人人都是产品经理平台仅提供信息存储空间服务。

更多精彩内容，请关注人人都是产品经理微信公众号或下载App

科技旋涡

专注于科技、智能和硬件领域。

122篇作品 197425总阅读量

互选广告推出，公众号变现有“出路”了吗？

07-087510 浏览

私域内容创作的10条「招式心法」

10-125102 浏览

如何持续提升产品质量？

06-076992 浏览

最全总结：To B 产品和 To C 产品的异同

12-253997 浏览

中国创业者，奋战越南电商

06-023164 浏览

目前还没评论，等你发挥！

区块链如何革命性地重塑我们的世界与创新之路？

10-121495 浏览
搅局者GPT-4已来，AR产业竞争格局迈入新维度

04-064296 浏览
618回归“价格战”：京东淘宝进入存量竞争，小红书、视频号深入电商直播

06-092282 浏览

一句话生成一分钟视频？元宇宙的救星果然是AI

一、能视频生成，就构建元宇宙场景？

二、元宇宙场景搭建 不再遥远

三、未来已来 但挑战依然

二、元宇宙场景搭建不再遥远

三、未来已来但挑战依然