当每一次生成都要花钱：从Sora之死看AI时代的产品新逻辑

搜索

APP

起点课堂会员权益

职业体系课特权

线下行业大会特权

个人IP打造特权

30+门专项技能课

1300+专题课程

12场职场软技能直播

12场求职辅导直播

12场专业技能直播

会员专属社群

荣耀标识

发布

当每一次生成都要花钱：从Sora之死看AI时代的产品新逻辑

ChenXiaowu

2026-04-05

0 评论 3820 浏览 4 收藏

29 分钟

AI视频生成的商业逻辑正在经历残酷洗牌。OpenAI突然关停Sora的背后，是每天烧掉1亿人民币却只收回零头的经济灾难；而中国可灵和即梦的涨价策略，则展示了B端商业场景的惊人盈利能力。本文深度拆解两种商业模式的生死分野，揭示AI产品必须面对的五大成本革命。

最近刷到一条旧闻的二次讨论——OpenAI在3月24号正式宣布关停Sora。

这个事情发生已经有一段时间了，但我最近反复看到各种角度的讨论，突然冒出了一些新的想法。不是关于”AI视频技术多厉害”，而是一个更底层的疑问：

为什么一个技术公认最强、热度公认最高的产品，会因为“赚不到钱”被自己的亲爹拔管？ 而同一时间，中国的可灵和即梦却在闷声数钱——甚至敢在Sora关停当天直接涨价？

想来想去，我觉得答案不只是”Sora运气不好”这么简单。 它其实揭示了一个正在发生的巨大范式转换——AI产品和传统互联网产品，在底层的成本逻辑上是完全不同的两个物种。 如果我们还用做传统互联网产品的思维来做AI产品，结局很可能就是下一个Sora。

所以今天这篇文章，我想聊的核心是：当AI时代每一次生成、每一次对话、每一个功能都有实实在在的算力成本时，我们做产品的思路到底应该怎么变？

我们先来看看 Sora 到底是怎么死的

先看一笔让人窒息的账

Sora每生成一个10秒的高清视频，用户端大约等一两分钟就能出片，但后台的算力消耗是实实在在的。折算下来，生成一个10秒视频的算力成本在0.5到2美金之间，取中位数大概1美金出头——换成人民币，差不多7到9块钱一条10秒短视频。

你可能觉得七八块钱也不贵。但问题出在规模上。

Sora在流量巅峰期，每天有数百万人在使用，而且很多人不止生成一条。叠加起来，高峰时期一天的推理成本高达1500万美金，折合人民币超过1个亿。

而从2025年9月App上线到2026年3月关停，整整半年时间，Sora在应用内购的总收入是多少呢？

210万美金。大约1500万人民币。 这还是用户实打实付出去的钱，一分成本都还没扣。

光峰值那几周的烧钱，就已经是这半年总收入的几百倍。整个生命周期赚到的钱，连一天的算力账单都覆盖不了。

不仅仅是烧钱，用户的留存率也不行

更要命的是用户数据。Sora独立App上线初期下载量非常猛——2025年11月下载量达到330万次的峰值。但到2026年2月就暴跌到113万，三个月跌了66%。

30天留存率跌到个位数。意味着100个人下载了Sora，一个月后只有不到10个人还在用。

留存率低的主要原因是普通用户没有持续生成视频的刚需。大多数人的使用路径是这样的：下载 → 生成一段”孙悟空大战变形金刚”的搞笑视频 → 发到社交平台 → 收获点赞 → 删掉App。整个过程就像玩了一次新奇的游戏，新鲜劲过了就走。

这种”一次性游玩”的用户行为，与OpenAI给出的免费额度策略产生了致命的错配。Sora曾经对所有用户开放每天30次免费生成（Pro用户高达100次）。理论上，免费额度是诱饵，让用户尝到甜头后转化为付费会员。但现实是：被猎奇视频吸引来的用户，30条免费额度足够他们玩腻、发完朋友圈、然后卸载——既没转化为Pro会员，也没形成持续使用习惯，徒然消耗了大量算力。

更要命的是背后的数学。按照ChatGPT Plus每月20美金的订阅价格，用户只要一个月生成超过16条视频，消耗的算力成本就已经超过他付的钱。 而大部分Pro用户远不止生成16条。这意味着：免费用户在亏钱，Pro用户也在亏钱；拉新越多，亏损越深。

这完全是传统互联网”先免费圈用户，以后再想办法赚钱”的打法。在互联网时代，这个逻辑是成立的——因为多一个用户几乎不增加成本。但在AI时代，每一个免费用户的每一次生成，都在消耗实打实的GPU电费和算力。用户越多，亏得越多。

但免费额度还不是根本原因。根本原因有两个：

第一，Sora追求的效果太完美了。 它的底层目标是做一个”世界模拟器”——为了让水花溅起来符合流体力学，要额外消耗一大块算力；为了让光线追踪到每一个光子的反射路径，又要吃掉一大块；物体碰撞要遵循牛顿力学。这些物理级别的模拟占了推理成本的绝大部分，但对于绝大多数商业场景来说——拍一个15秒的带货视频、做一个30秒的短剧片段——这些物理细节根本用不上。

第二，用户群体完全错配。 Sora吸引来的是一大波C端猎奇用户，而不是持续付费的专业创作者。30天留存率不到10%就说明了一切——这些用户不创造商业价值，但每一条生成都在烧钱。

说白了，Sora同时犯了两个错：技术端追求极致效果导致成本居高不下，商业端沿用传统互联网免费策略导致收入远远兜不住成本。两头挤压，中间就是一个巨大的亏损黑洞。

最后一根稻草

Sora的团队负责人Bill Peebles在2025年10月就公开承认了——“这个经济模型完全不可持续。”

但真正让OpenAI下决心拔管的，不只是Sora本身的亏损，更紧迫的是来自竞争对手的压力。2026年OpenAI正在冲刺IPO，估值号称数千亿美金，但与此同时，Anthropic正在凭借更强的编程能力、代码生成能力和Agent功能，疯狂抢夺OpenAI的企业级客户。 用户正在向Anthropic流失，而这直接关系到OpenAI最核心的收入来源。

每天给Sora烧掉的GPU资源，如果节省下来用于支撑GPT-5.5、GPT-5.6以及后续产品的迭代，去强化那些被Anthropic超越的编程和Agent能力，产出的商业价值可能是现在的几十倍甚至上百倍。

用Sam Altman自己的话说：“我们需要把算力和产品力集中到下一代自动化研究和企业服务上。” 翻译一下就是——Sora这个坑太大了，不填了，必须把资源抢回来守住基本盘，去跟Anthropic抢客户、去推下一代大模型。

连迪士尼10亿美金的投资都泡汤了——据报道，迪士尼是在关停公告前一天才被紧急通知的，钱一分没到账。

同一赛道，可灵和即梦为什么活得好？

Sora关停的同一天，字节跳动旗下的即梦平台做了一件很有意思的事——取消了折扣，直接涨价。

一个在拔管，一个在涨价。为什么差距这么大？

我仔细看了可灵和即梦的模式，发现它们的关键选择可以总结为两种完全不同的商业模式：

模式一：快手的”专科诊所”模式

可灵AI到2026年1月，年化收入已经超过3亿美金，折合人民币超过20亿。 预计2026年还能翻一倍。

它是怎么做到的？

第一，精准定位谁来用。 可灵从一开始就不追求”让所有人做导演”这种乌托邦口号。**它瞄准的是电商商家、广告公司、短剧工作室这些B端专业用户。**这些人有明确的商业目的：生成带货视频能帮他们省下几万块真人拍摄成本，生成短剧片段能让他们快速试错，所以他们愿意持续付费。

可灵的定价体系是这样的：黄金会员66元/月，铂金266元/月，钻石666元/月，黑金1314元/月。这些价格对于有商业回报预期的专业用户来说，完全可以接受。

第二，成本控制到位。可灵每秒视频生成成本大约0.07美金，折合人民币5毛钱一秒。 和Sora的9块钱10秒（大约9毛一秒）相比，便宜了将近一半。而且可灵已经实现了推理层面的毛利率转正——每生成一条视频至少不亏钱。

可灵3.0通过API调用的价格大约是每秒0.075美金，它不需要一个”能模拟整个物理世界”的通用模型，只需要一个在短剧和电商场景深度优化的专用模型。效果在这些场景里完全够用，成本却只有通用方案的几分之一。

第三，免费额度控制得聪明。 可灵给免费用户每天66积分，够生成几个低分辨率、带水印的短视频。想要高清无水印？付费订阅。这个免费额度足以让你尝到甜头，但不会让你白嫖到公司亏钱。

第四，嵌入了快手自己的生态。 创作者用可灵生成内容，直接发到快手平台上，获得流量分发和商业变现。创作-分发-变现是一条完整的闭环。

模式二：字节跳动的”内循环飞轮”

字节的策略更狠——Seedance 2.0几乎不单独对外卖，而是直接嵌入自己的超级流量生态里。

它的运转逻辑是这样的：Seedance生成的带货切片、引流短剧、转场特效 → 通过剪映分发给千万创作者 → 创作者把内容发到抖音和TikTok → 算法推荐产生播放量 → 播放量转化成广告费和电商成交额。

算力成本在字节内部就消化掉了。 Sora需要向用户收费来覆盖成本，但Seedance不需要，因为它的算力成本最终通过广告和电商GMV来回收。这就像一个工厂的电费——你不需要让员工掏电费，因为员工生产的产品卖出去就能把电费赚回来。

即梦敢取消折扣涨价的逻辑也很简单——C端猎奇用户走掉没关系，B端愿意掏钱的专业创作者留下来就行。

当然，它们也不是没有挑战

这里值得提一句的是，即使是活得好的产品，算力约束也是真实存在的。字节的即梦在使用高峰期经常出现几小时的排队等待，用户体验并不完美。Seedance 2.0的生成成本据说也已经接近每秒1块钱人民币的量级——虽然商业模式能支撑，但如果用户量继续暴涨，算力瓶颈是当下视频生成领域要面对的主要问题。

这恰恰印证了我想说的核心观点——在AI时代，算力成本是一个真实的物理约束，不是靠烧钱就能突破的。即使是赚钱的产品，也必须时刻在成本和效果之间做取舍。

这不只是Sora一家的问题——AI产品的五个底层逻辑变化

聊到这里你可能觉得，这是视频大模型的事，跟做其他AI产品的人有什么关系？

关系非常大。因为Sora的死，和可灵/即梦的活，共同揭示了一个正在影响所有AI产品的根本变化——

传统互联网时代，产品的边际成本趋近于零。AI时代，每一步操作都有实实在在的生成成本。

这两句话看起来简单，但展开来想，**它会颠覆我们习以为常的几乎所有产品设计逻辑。**具体体现在五个维度：

第一个变化：从”用户越多越好”到”用户越精准越好”

以前做互联网产品，我们追求DAU、MAU，追求增长曲线。因为多一个用户几乎不增加成本，但多一个用户意味着更多的数据、更高的广告价值、更好看的融资故事。所以那个时代的产品策略就是”不管三七二十一先拉来用户再说”——拼多多的百亿补贴，美团的红包大战，本质上都是这个逻辑。

但AI产品呢？每一个用户的每一次操作，都在消耗GPU。 一个不付费的用户在Sora上生成10条视频，OpenAI就要掏出大概90块人民币的算力费。用户越多，亏得越多。

这意味着AI产品的核心指标不再是DAU，而是每单位算力产生的收入。用户不是越多越好，而是越精准越好。 可灵和即梦敢涨价，正是因为它们想清楚了一件事：要服务那些有明确商业回报预期的B端用户，而不是猎奇的C端玩家。

第二个变化：从”追求技术极致”到”追求成本可控的效果”

Sora的悲剧不是功能做太多了，而是它追求的效果太完美了。

为了让水花溅起来符合流体力学，要额外消耗一大块算力。为了让光影追踪到每一个光子的反射路径，又要吃掉一大块。这些”物理级真实感”在技术上确实惊人，但对于拍一条15秒的带货视频或者一个30秒的短剧片段来说，根本用不上。

反过来看可灵和Seedance怎么做的——它们聪明地避开了“模拟整个物理世界”这条路，转而聚焦在几个有限场景：短剧的室内场景和微表情、电商的固定货架和衣服质感。 物理边界极度缩减之后，模型砍掉了大部分无用计算，成本直接降了一个量级。

这给做AI产品的人一个很重要的启示：不是技术上能做到的都应该做。要在“效果足够好”和“成本可承受”之间找到那个平衡点。

顺带一提，斯坦福大学人类中心AI研究所的2025年AI Index报告有一组数据——通用大语言模型的推理成本在2022年11月到2024年10月之间降了大约280倍。这听起来很乐观对吧？但同一时期企业的AI总支出反而涨了320%。因为降价带来了更多使用量——每个AI Agent完成一个任务要调用大模型10到20次，RAG架构每次查询要塞入几倍的上下文……单价降了，但用量涨得更快。

所以，依赖“未来成本会降”来解决今天的亏损问题，是不靠谱的。成本控制必须在产品设计阶段就想清楚。

第三个变化：从”免费增值”到”价值前置”

互联网的经典模式是Freemium——先让你免费用，等你用习惯了再收费。这个模式的前提是免费用户的边际成本几乎为零。

但在AI产品上，每一个免费用户都在实打实地消耗算力。 Sora给免费用户每天30次生成机会，结果就是——用户是拉来了一大波，但每天在疯狂烧钱，留存又极低。

AI时代可能需要一个反过来的逻辑：先让用户看到价值，再开放使用。

不是”先免费用再付费转化”，而是 “先展示这东西能帮你省多少钱、赚多少钱，然后你付费使用”。

目前行业里做得好的AI产品，大多数在用一种混合模式——基础订阅费打底，附带一定的使用额度，超出部分按量付费。比如可灵的标准版大约50块人民币月费，包含一定积分，超额使用再加购。这样既保证了收入可预期，又把成本控制在可承受范围内。

第四个变化：从”全在云上”到”端云混合”

为了降低推理成本，越来越多的AI计算在往终端设备走。2026年市面上带NPU（神经网络处理器）芯片的手机和电脑越来越多——苹果的M系列芯片、高通的骁龙8系列、联发科天玑系列，都内置了AI运算单元。

这意味着什么？**意味着以后不是所有AI功能都需要联网传到云端去跑大模型。**简单的任务——比如语音转文字、照片美化、基础的文本摘要——可以直接在你的手机或电脑本地完成，不需要消耗云端算力。只有真正需要大模型能力的复杂任务，才上传到云端。

这对产品设计的影响是：未来的AI产品可能需要考虑模型的分级适配——哪些功能在端侧跑小模型，哪些功能调用云端大模型，中间怎么无缝衔接。不同手机芯片的算力不同，同一个功能在高端机和中端机上可能要用不同的模型版本。这本身就是一个新的产品设计课题。

行业里管这个叫”模型路由”——一个智能分发系统，自动判断每个请求应该发给本地小模型还是云端大模型。简单任务走本地，复杂任务走云端。据分析，这种策略平均能降低40%到50%的推理成本。

第五个变化：因为每一步都花钱，反而倒逼出更好的产品——兼论AI产品为什么存在

这是我个人觉得最有意思的一点。

表面上看，”每个功能都有成本”是一种约束、一种限制。但换个角度想——正因为有了成本约束，产品团队反而被迫去想清楚“用户到底最需要什么”。

以前互联网做产品，功能不花钱，堆就是了。堆错了也没什么损失，大不了下个版本去掉。但AI时代每个功能背后都有推理账单，堆一个没用的功能就是实实在在的亏损。

这种压力反而催生出更精准的产品设计。

有一组数据特别说明问题：某AI设计工具做了A/B测试，发现完全由AI自动生成的设计稿，用户采纳率只有12%。但如果用户自己画个草图、让AI在这个基础上优化呢？采纳率飙到81%。

为什么？因为全自动模式下，AI要消耗大量推理成本去”猜”用户想要什么——猜错了用户就不用，等于白白烧了算力。而用户先给方向再让AI执行，AI的工作量缩小了一半，出来的结果反而更贴合需求。

成本更低，效果更好。这不是一个折中方案，这是最优解。

推而广之，AI时代做产品的核心思路可能是：让人做人最擅长的事（定方向、做判断、给创意），让AI做AI最擅长的事（执行、渲染、批量生成）。 人脑20瓦搞定决策，GPU几千瓦搞定干活。各自在自己效率最高的区域工作。

但这里还有一个更深层的问题：如果用户直接去调用最顶级的大模型API（比如Claude Opus 4.6或者GPT-5.4），理论上可以完成几乎任何任务。那为什么还需要AI产品存在？

答案就在成本里。

顶级模型每次调用的成本很高。但一个做得好的AI产品，可以通过工程化手段——在特定领域里达到接近顶级模型的效果，同时把成本大幅降下来。

怎么降？除了前面提到的模型路由和端云混合，还有：

开源模型微调： 用开源模型（比如Qwen、Llama）在特定领域做精调，在那个领域内效果不输顶级模型，但成本只有零头。
工作流编排： 把一个复杂任务拆成多个步骤，每个步骤用最合适（也最省钱）的模型来处理，而不是全程调用最贵的那个。
Prompt工程+缓存： 优化输入prompt减少token消耗，对重复查询做语义缓存避免重复计算。

可灵本质上就是这个逻辑——它不需要一个”能模拟整个物理世界”的通用模型，只需要一个在短剧和电商场景深度优化的专用模型。效果在这些场景里完全够用，成本却只有通用方案的几分之一。

AI产品存在的核心价值，就是在特定领域里实现“效果够好+成本够低”的最优组合。 这才是用户选择你而不是直接去用顶级模型API的理由。

真正能活下来的AI产品，可能恰恰是那些最清楚自己不做什么的产品。 它们不追求全能，而是在一个明确的领域里，用最高的效率解决最刚性的需求。用户为它买单，不是因为它什么都能做，而是因为它在他们最需要的那个点上，做到了”效果够好、价格能接受”。

回到Sora——它的死带来了什么

最后说说Sora的死对行业的影响。

短期来看，中国的AI视频玩家直接受益了。可灵和即梦在Sora退场后拿到了更多的市场空间和用户关注度。Seedance 2.0在今年春节期间的热度远超预期。可灵在全球视频生成榜单上已经稳居前两名。

中期来看，Sora的死加速了整个行业从“炫技”到“赚钱”的转向。 投资人不再只看技术demo多酷炫，而是开始问”你的单位经济学算清楚了吗”。连OpenAI自己也在调整战略——把ChatGPT、编程工具Codex和浏览器Atlas合并成一个聚焦企业生产力的”超级应用”，明确表示不再追求”moonshot式的内部创业”。

长期来看，Sora的死可能标志着一个时代的分水岭——从“技术驱动”到“成本驱动”的转变。以后做AI产品，第一个要回答的问题不再是“我们能做什么”，而是“在可承受的成本下，我们该做什么”。

这听起来似乎没那么酷了？但我觉得恰恰相反。

互联网时代那种”什么都免费、什么都要做、先烧钱再说”的狂飙突进，本质上是靠投资人的钱撑出来的幻象。当每一步都有成本的时候，产品人才真正需要回答一个最朴素的问题——用户到底愿意为什么买单？

能回答好这个问题的产品，才是真实的产品。