亲测MiniMax海螺视频:有惊喜,但不如Sora稳定

0 评论 857 浏览 0 收藏 12 分钟

MiniMax 公司近日推出了其首款 AI 高清视频生成模型 "abab-video-1",标志着其在 AI 视频生成领域的雄心壮志。在这篇文章中,我们将深入探讨这一技术的实际表现,与 OpenAI 的 Sora 模型进行比较,并分析 MiniMax 在国内外市场的战略布局。

新AI四小龙之中,再添一位“Sora玩家”。

8 月 31 日,MiniMax对外发布了其公司首款 AI 高清视频生成模型技术“abab-video-1”。

具体生成效果,可以在海螺AI官网中的海螺视频体验,目前最高支持原生分辨率1280*720的25帧视频,最大时长为6秒(未来或将延长至10秒),据称“效果不亚于Sora”。

MiniMax 海螺AI

官网给出了大量不同提示词类型的演示视频,MiniMax创始人兼CEO闫俊杰透露,现在的产品“只是第一版”,且“很快还会有更新”。

策略是可能会先在每一两周出现新的东西、更加满意状态后,再考虑一些商业化,包括开放平台、广告变现等方式。

消息面上,这家新杀入视频生成赛道的AI独角兽,此前其实少有对外发声,但从视频生成效果来看,无疑也是有备而来。

01 国产Sora仍有提升空间

MiniMax在演示中使用的提示词,有相当一部分是较为复杂和具体的场景故事,包含大量细节描述。

而模型最终呈现的效果,完成度也相当高。看得出,MiniMax对模型能力也比较有把握。

蓝媒汇选了一些演示所用的提示词喂给MiniMax的对话模型,要求模型仿照其中对场景和运镜的描述,写三段新的提示词,手动优化后再喂给视频生成模型:

在一片幽静的山林中,镜头以一种缓慢而沉稳的动态运动,缓缓推进,穿过密集的树木和缠绕的藤蔓。阳光透过树梢,斑驳地洒在地面上,形成一片片光影交错的图案。镜头聚焦于一只悠闲觅食的小鹿,捕捉它轻盈跳跃的瞬间,同时运用动态模糊技术,营造出一种宁静而神秘的氛围。

画面偏暗以体现描述中的“幽静”,小鹿的运动姿态也非常合理,只是在穿过树枝的几帧,轮廓有些细微的畸变,稍显不协调。但瑕不掩瑜,整体质感相当不错。

以及,生成所需排队等待的时间,在同一时段和智谱清影、快手可灵对比都很接近,这大概是目前行业在平衡算力成本和用户体验后,效率方面给出的通解了。

第二段提示词:

宁静的湖畔,微风拂过时水中产生波纹。湖面上的倒影随着微风轻轻摇曳,形成一幅动人心弦的画面。通过延时摄影记录日出时分,湖面从一片宁静的黑暗逐渐被晨光染成金色的过程。整个视频以电影效果的调色和柔和色调处理,营造出一种宁静而深邃的氛围,讲述着大自然的宁静与和谐。

在第一遍生成的视频中,构图相对简单,水面效果和光影质感都非常OK,但模型显然没有完成“日出场景”和“延时摄影”两项要求。

并且,在将提示词微调,单独突出“延时摄影”和“黑暗到日出”两处要求后,模型第二次跑出的视频依然没能get到重点。

第三段提示词:

在繁忙的都市天际线背景下,镜头以一种充满活力的动态运动穿梭于高楼大厦之间。阳光在玻璃幕墙上的反射,形成一道道耀眼的光束,镜头由近到远,捕捉都市快节奏生活的动感。随后,延时摄影技术记录下城市从清晨到夜晚的转变,从第一缕晨光点亮城市到夜幕下灯火辉煌的景象,展现出都市生活的节奏与活力。

这一次,海螺视频的AI完全理解了白到黑的变化,但严格来说镜头是切换到了另一个画面,并非固定机位的延时摄影,前后画面中出现的内容也并无明显关联。

货比三家,将这一提示词同样喂给蓝媒汇此前测试过的快手可灵和智谱清影,默认参数设置下:

可灵:生成的房屋轮廓相对稳定,远景有一定程度的畸变,但没有做出通过延时摄影体现白天到夜间的变化。

清影:生成的房屋轮廓变形略显严重,不过抓住了提示词中关于镜头和光影的绝大部分要求。

当然,不排除是输入的提示词并没有用最适合AI理解的表达方式,换一位更专业的模型训练者来写效果会更好。

但即使是这样,对于一款需要落地日常内容创作、寻求商业化的产品,如果在理解需求阶段就有“提示词专业格式”这类门槛,想必也会劝退部分有意向的使用者。

不管问题是出在提示词输入,还是模型理解和生成,现有的视频质量与OpenAI放出的Sora演示视频相比,都明显缺乏稳定性:对于提示词的稳定理解,和画面一致性。

显然,短期内无法达到“实用创作工具”的范畴。

02 出海有商机

一个有意思的点,在海螺视频官网右上角,给了两个社群入口,一个是飞书,另一个是Discord。

飞书主要面向国内用户,而被墙的 Discord 则完全是面向海外用户的渠道。实际上,MiniMax 在海外的产品布局已取得了部分成功。

Sensor Tower统计数据显示,MiniMax旗下产品 Talkie 今年6月Talkie在美国免费娱乐类应用榜上排名第五,全球月活跃用户数达到1100万,其中超过半数来自美国,其余用户则分布在英国、加拿大等国家。年内下载量380万也仅次于ChatGPT等头部应用,排名第四。

闫俊杰此前透露称,Talkie自2023年6月上线后,累计下载量已接近1400万次,总营收近83万美元。并且,与头部AI虚拟人公司Character.ai的差距逐步减小,月活已经接近Character.ai的60%。

对比其面向国内的AI内容社区星野,虽然后者在国内主流AIGC APP中也做出了一定声量(Quest Mobile数据显示,星野为国内少有月人均使用天数超过7天的APP,豆包和文心一言等为五天左右),但商业化却少有提及,海外市场的付费潜力短期内仍更为可观。

此前在行业沟通会上,部分业内人士指出,从市场现状来看,海外用户在付费意愿和习惯上都远远优于国内用户。

有消息称,OpenAI大模型ChatGPT付费订阅用户目前已经超过1100万。艾媒咨询数据显示,未来全球平均用户娱乐付费意愿呈增长趋势,美国、英国、法国、德国、日本、韩国六国未来愿意付费获取娱乐服务的用户比例都超过现有用户比例,这意味着海外用户对娱乐相关互联网产品的付费意愿在不断增强。

MiniMax国际业务总经理盛静远近期接受采访时称,海外市场打法相对直接,变现也更快。而公司现在技术已处于领先,更多是公司经历、资源和变现问题。

看起来,MiniMax已经选好了更接近商业化的业务落点。

不过,最新市场消息显示,公司Talkie和星野等C端AI产品负责人,曾任职于百度、知乎、字节的张前川近期已淡出MiniMax公司业务,处于休假状态,接近离职。

据称,张前川任职期间参与了大量Talkie、星野中的玩法设计——变化,或许要来了。

作者|陶然 编辑|魏晓

本文由人人都是产品经理作者【蓝媒汇】,微信公众号:【AI蓝媒汇】,原创/授权 发布于人人都是产品经理,未经许可,禁止转载。

题图来自Unsplash,基于 CC0 协议。

更多精彩内容,请关注人人都是产品经理微信公众号或下载App
海报
评论
评论请登录
  1. 目前还没评论,等你发挥!