抖音,非AI时代最后一个APP的绝唱

0 评论 261 浏览 1 收藏 25 分钟

抖音或许是移动互联网时代最后的全民级APP,AI时代的真正爆发仍需跨越算力、电力与存储三座大山。本文深度剖析从拨号上网到5G时代的基建演进逻辑,揭示为什么当前AI应用仍停留在'文本流'阶段,并预测只有当算力成本降至'包月无限量'套餐水平时,才能诞生下一个颠覆性产品。

如果你现在去观察整个中国乃至全球的移动互联网生态,你会发现一个令人深思的现象:在抖音(TikTok)横空出世并席卷全球之后,移动互联网已经整整好几年没有出现过真正意义上的“全民现象级APP”了。不仅没有新的颠覆者,连现有的巨头们也都在存量市场里进行着残酷的内卷。

其实,如果你看透了互联网底层的发展逻辑,你就会明白一个残酷而又客观的事实:抖音,就是非AI时代最后一个APP的绝唱。在这之后,在AI时代的基础设施真正成熟之前,你再也看不到同量级的、能够瞬间颠覆所有人生活方式的软件了。

纵观中国乃至全球互联网这波澜壮阔的三十年,每一次的全民级风口,表面上看是某几个天才产品经理的灵光一闪,是某种商业模式的创新,但本质上,它们全都是踩着底层硬件和网络基建升级的节点到来的。互联网从来都不是魔法,它的每一次形态跃迁,都是底层通信技术、算力和存储技术的一次“外溢”。

今天所有人都在谈论AI,谈论大模型,谈论Sora和ChatGPT。但为什么AI至今没有诞生一个像当年微信、抖音那样,让村口的大爷大妈都能抱着手机刷上一整天、完全离不开的应用?

答案很简单:因为现在的AI,还处在二十五年前的“拨号上网”阶段。

本文将带你穿梭互联网三十年的基建演进史,深度剖析为什么从文字流、图片流、视频流再到AI流,每一步的跨越都受到硬件的绝对制约;并详细拆解,为什么在AI彻底解决“算力、电力、存储”这三大基建难题之前,它注定只能是少数人的昂贵玩具,而无法成为普惠大众的“下一个抖音”。

一、三十年基建演进史——媒介形态的“硬件决定论”

我们去回顾过去三十年的互联网发展,会发现一个非常清晰的媒介降维、流量升维的过程:文字 -> 图文 -> 长视频 -> 短视频。在这个过程中,哪种媒介能火,什么时候能火,从来不是由内容创作者或者软件公司单方面决定的,而是取决于底层的网络带宽和算力到底有没有到位。只有国家和全人类的底层基建到位了,才能撑得起一种新的全民级娱乐方式。

1. 纯文本流时代:56K拨号与论坛的黄金岁月

时间倒退回二十五年前,那是20世纪末到21世纪初的中国。那个时候,我们上网用的是什么?是电话线,是56K的“猫”(Modem)。伴随着那阵刺耳而又充满机械感的“滴——嘟——嘶”的拨号音,我们艰难地接入了早期的互联网。那点可怜的宽带,理论峰值速度只有不到7KB/s。在这样的网络环境下,你根本别想看什么视频,甚至连加载一张高清图片都要等上几分钟,看着图片像拉百叶窗一样一行一行地显现出来。

所以,那个时代火的是什么?是BBS(电子公告板),是天涯论坛,是猫扑,是水木清华,是早期的文字MUD游戏。论坛之所以能火,不是因为那时候的人比现在的人更喜欢看长篇大论,主要是因为你的网络只能跑得动文字。纯文本的数据量极小,几KB就能承载成千上万字的信息,这是当时极其受限的基建环境下,人类唯一能实现的低延迟、高并发的交互方式。

2. 图文流时代:宽带普及与贴吧的崛起

后来,基建升级了。ADSL宽带逐渐普及到了千家万户,我们的网速从56Kbps跃升到了512Kbps、1Mbps甚至2Mbps。网络带宽的拓宽,让稳定、快速地传输图片成为了可能。这个时候,互联网的媒介形态立刻发生了质变。百度贴吧、各种博客、早期的QQ空间开始火爆。那是一个“图文并茂”的时代。人们不再满足于干瘪的文字,各种表情包、照片、连载漫画开始成为互联网流量的绝对主力。

3. 长视频时代:光纤入户与流媒体的狂欢

再往后发展,国家大力推进“宽带中国”战略,光纤入网(FTTH)让家庭宽带直接飙升到了10Mbps、100Mbps。只有到了这个节点,支持高清画质的长视频才有了生存的土壤。于是,土豆、优酷、搜狐视频、腾讯视频、爱奇艺这些视频网站如同雨后春笋般活了起来。那是一个看剧的时代。大家开始习惯于在电脑前一坐就是几个小时,享受着不卡顿的720P甚至1080P视频。如果没有光纤基建的大规模铺设,这些视频网站在传输成本和带宽压力下,早就破产无数次了。

4. 短视频时代:3G/4G/5G与移动基建的红利

紧接着,真正的颠覆来了——移动互联网的到来。从3G网络的预热,到智能手机(特别是iPhone和安卓阵营)的全面普及,再到4G甚至5G网络的全面覆盖。更重要的是,运营商的资费流量被打到了地板价。

这就是为什么我们迎来了短视频时代。抖音、快手之所以能爆火,不仅仅是因为它们有着让人上瘾的推荐算法,更核心的前提是:随时随地刷视频的网络条件成熟了。

二、为什么抖音是“最后的绝唱”?

当我们理解了上述的“硬件决定论”后,就会明白我为什么会说:你把现在的抖音放回二十年前,不仅抖音活不下去,连你都会倾家荡产。

想象一下二十年前,也就是2004年左右的移动网络(当时还是2.5G的GPRS时代)。那时候的流量有多贵?中国移动著名的“5元30兆”套餐,折算下来,一块钱只能买几兆的流量。如果换算成GB,一个G的流量你得交将近一千块钱。

现在的抖音,一个短视频动辄几十兆,你如果在那种基建环境下敢抱着抖音刷一天短视频?你根本刷不到半天,你家房子就归中国移动或中国联通了。

这就是“基建门槛”的威力。

抖音之所以是最后的一曲绝唱,是因为现在的我们,正站在两个时代的交界口上。

1. 移动网络基建“红利”已被吃干榨尽

从4G过渡到5G之后,我们发现了一个很尴尬的事实:5G并没有带来像4G当年那样革命性的杀手级应用。为什么?因为对于目前的平面视频媒介来说,4G的速度已经足够快了,足以让用户无感知地滑动切换高清视频。当传输速度和流量成本不再是瓶颈时,“传输型”互联网的发展就已经摸到了天花板。抖音的底层逻辑是“海量内容 + 极低传输成本 + 算法分发”。当基建把传输成本降到趋近于零(比如各种几十块钱的无限量爽卡)时,抖音这种利用人类多巴胺奖励机制的形态,就已经把非AI时代的娱乐体验拉满了。

2. 从“信息传输”到“信息生成”的质变

非AI时代的所有应用——无论是贴吧、微博、爱奇艺还是抖音——它们本质上解决的都是信息的“分发与传输”问题。视频是人拍出来的,平台只是负责把它通过网络极其廉价地传输到你的屏幕上。而AI时代是完全不同的。AI应用解决的是信息的“实时生成”问题。生成信息所消耗的资源(算力),和传输信息所消耗的资源(带宽),完全不是一个量级的概念。

非AI时代的基建(光纤、4G/5G基站)已经挖到了顶,进入了瓶颈状态。而面向AI时代的基建(算力中心、GPU集群),却又远远不够。这就是为什么在抖音之后,互联网陷入了长期的爆款停滞期。

三、AI时代——回到“拨号上网”的史前时期

现在所有人都热衷于聊AI,聊大模型如何颠覆世界。但如果你剥开那些华丽的公关词汇,去看看普通人到底是怎么使用AI的,你会发现一个极其魔幻的现实:

虽然时间已经来到了21世纪的第三个十年,但AI的发展阶段,本质上跟二十五年前的“拨号上网”一模一样。

1. 为什么说我们还在AI的“纯文本流”时代?

你看现在市面上最火的AI应用:ChatGPT、Claude、文心一言、Kimi……大多数人哪怕付费开通了会员,日常用它来干嘛?写邮件、写报告、总结长文、写代码、甚至就是无聊了跟它聊聊天。发现没有?本质上,你在AI时代经历的,依然是一个“文本流”阶段。

你输入的prompt是文字,它吐出来的回答也是文字。它就像是一个极度聪明的全知全能者,通过“BBS论坛回帖”的方式在跟你交流。为什么会这样?是因为各大AI厂商做不出AI视频吗?不是的。Sora早就展示了其强大的视频生成能力,各种文生图模型(Midjourney、Stable Diffusion)也已经非常成熟。

那为什么你在你的手机APP上,不能像刷抖音一样,随心所欲地刷由AI为你实时生成的、独一无二的专属短视频?

核心就一个原因:太贵了,民用阶段现在根本玩不起。

我们可以用一张系统流程图,来看看非AI时代与AI时代的成本与爆发条件的本质区别:

2. 算力成本的残酷账本:一个月18000块的“AI抖音”

我们来算一笔非常现实的经济账。在目前的算力成本下,使用顶级的大模型生成一秒钟高质量的AI视频(类似于Sora的质量),其背后的GPU推理成本大约是一块钱人民币。

听起来,一秒钟一块钱,对于尝鲜的科技发烧友来说,好像挺便宜对吧?你花个十块钱就能生成一个十秒的酷炫视频发朋友圈装杯。但是,如果你把它作为一个全民级的高频日常应用来计算呢?

假设有一个完全由AI实时生成内容的“AI版抖音”。根据统计,目前中国网民每天在短视频上花费的平均时间大约是120分钟。我们保守一点,假设一个人每天用这个AI软件60分钟。一天60分钟,就是3600秒。一秒钟一块钱的成本,意味着这个用户每天在平台上消耗的算力成本是3600元。那一个月(30天)是多少?是惊人的108,000元人民币!

就算随着技术进步,我们在短期内把成本压缩到十分之一(一秒钟一毛钱),一个人一天看60分钟,一个月的成本依然高达10,800元。再退一万步,哪怕通过各种黑科技把成本再砍掉一半,那每个月的算力硬成本也在5000元以上。

而现实是什么?2023年,全国居民人均每月可支配收入大约是3268元。这意味着什么?意味着你如果像刷抖音一样去刷高质量的AI实时生成视频,你玩个软件大半个月的工资都没了。连维持它运转的电费和GPU折旧费都付不起,更别提平台还要赚钱了。

所以,认清现实吧。无论概念炒得有多火、多热,在民用阶段,现在的AI实在是太贵了。现有的算力基建和硬件设备,根本支撑不起AI成为像“视频流”那样全天候、全民级的应用形态。

四、卡住AI时代的“三座大山”——算力、电力、存储

如果说非AI时代是由“基站、光纤、宽带”这三驾马车拉动的,那么决定AI时代何时能够真正降临的,是业内一句非常著名的论断:

“短期缺算力,中期缺电力,长期缺存储。”

这不仅仅是硬件工程师的抱怨,它是直接决定你我什么时候能用上廉价AI应用的三道生死关卡。只有这三道关卡被彻底攻克,AI的基建才算真正到位。

为了清晰展示这三大瓶颈的关系,我们可以参考以下实体关系图(ER Diagram):

1. 短期瓶颈:算力(Compute)之困

当前AI面临的最直接的瓶颈,就是算力。我们在生成AI内容时(这个过程在学术上叫“推理 Inference”),需要进行海量的矩阵乘法运算。这种运算对CPU来说效率极低,必须依赖GPU(图形处理器)或者专用的NPU、TPU。

目前,全球最高端的AI算力几乎被英伟达(NVIDIA)一家垄断,无论是H100还是更新的B200芯片,价格都极其昂贵,动辄几万甚至几十万人民币一张,而且还一卡难求。台积电(TSMC)的先进制程工艺和CoWoS高级封装产能也是满载状态。摩尔定律(芯片上集成的晶体管数量每18-24个月翻一番)在物理极限的逼近下,已经明显放缓。我们很难再像过去二十年那样,仅靠等待一两年,就能享受芯片性能翻倍且成本减半的红利了。

只要算力集群的造价降不下来,AI大模型厂商就不可能把生成视频的成本降到普罗大众能随意挥霍的程度。

2. 中期瓶颈:电力(Power)之劫

假设某一天,芯片技术取得了巨大突破,算力芯片变得像白菜一样便宜,AI就能普及了吗?很遗憾,接下来卡住人类脖子的,是电力。

OpenAI的创始人Sam Altman曾不止一次在公开场合警告:下一代AI的发展,最大的限制将是能源。训练和运行像GPT-4甚至GPT-5这样规模的庞然大物,其消耗的电力是极其惊人的。传统的互联网数据中心(IDC),一个机柜的功率可能只有几千瓦。而为了容纳高密度AI算力集群的机柜,单机柜功率动辄几十千瓦甚至上百千瓦。

这意味着什么?意味着几座大型的AI智算中心,其耗电量就能抵得上一座中型工业城市的总用电量。美国现有的电网老化严重,已经开始面临AI数据中心申请并网时的巨大压力。在国内,虽然我们的基建能力世界第一,拥有强大的特高压输电网络和丰富的西部绿电(东数西算),但如果要支撑起十几亿人每天高频使用AI视频生成,现有的能源结构依然会面临巨大挑战。

这就是为什么现在那么多科技巨头(比如微软)开始疯狂投资核聚变、小型模块化核反应堆(SMR)等新能源项目。因为没有便宜且近乎无限的电力,就没有便宜且近乎无限的AI。

3. 长期瓶颈:存储(Storage)之墙

当你拥有了无穷的算力和无限的电力之后,最后一个幽灵将会浮现——存储。在计算机体系结构中,这被称为“内存墙(Memory Wall)”。

AI在生成内容的时候,特别是处理长上下文、高清视频等多模态数据时,需要将庞大的模型权重(几十GB到几百GB)和中间状态(KV Cache)全部塞进显存中。现在的计算速度往往是被数据的“搬运速度”拖慢的。芯片算得再快,内存读写速度跟不上,芯片也只能干等着。目前被疯狂炒作的HBM(高带宽内存)就是为了解决这个问题,但它极其昂贵且良率难以提升。

此外,从长期来看,如果全民都在使用AI实时生成高质量的3D资产、4K视频流、甚至虚拟世界(元宇宙)的场景,这些由AI产生的海量非结构化数据,需要极其庞大的分布式存储系统和向量数据库来支撑。怎么把这些数据存下来、调取出来,将成为一个跨越十年的技术难题。

五、等待AI的“包月无限量”套餐

看透了这“三座大山”,我们就能得出最核心的结论:

第一,AI到底什么时候能彻底火遍大街小巷,真正改变每一个普通人的日常生活?千万不要去看纳斯达克的概念炒得有多火,也不要看那些华丽的发布会PPT有多震撼。你只看一条:底层的算力、电力和存储基建的发展速度,到底能不能支撑得起使用成本的断崖式暴跌。

第二,AI在现阶段,哪怕在B端商用市场(如影视制作、代码辅助、设计作图)能够大范围铺开,但在C端民用阶段,它真的很难真正“火”起来。这里的“火”,指的是像微信、抖音那样,跨越年龄层、跨越阶级、占用绝对用户时长的全民级火爆。核心原因只有一个:它太贵了,不符合互联网时代打败一切的“免费/极低成本”定律。

我们可以用一个状态图来生动地展示,AI必须经历的“降本”闯关之路:

端云结合:打破僵局的可能路径

那么,是不是普通人这辈子都用不起像抖音一样爽的AI应用了?当然不是。科技界解决成本问题通常有两条腿走路:

一是“大力出奇迹”的云端降本。随着下一代光电计算、量子计算概念的推进,以及室温超导等基础物理学一旦取得突破,云端算力和电力的成本可能会呈现指数级下降。

二是“权力下放”的端侧AI(Edge AI)。这就是目前所有手机厂商(苹果、华为、小米等)都在疯狂卷“AI手机”的原因。如果平台在云端替你生成视频太贵了,那就把经过压缩和量化的AI大模型,直接下载到你的手机上!利用你手机处理器里集成的NPU(神经网络处理器)来提供算力。你的手机虽然算力不如云端庞大,但耗的是你自家的电,用的是你已经买单的硬件。如果有一天,手机端侧的算力强大到可以实时根据用户的喜好,本地生成无缝的高清短视频流,那么AI视频普及的成本障碍就被彻底绕过了。

结论:基建决定上层建筑,静候风口降临

再说得直白一点吧:只有当你一个月只有50块钱话费,并且这点话费足够你完全没有任何心理负担、不受任何限制地无限刷一个月高清视频的时候,抖音,才能真正走进千家万户。这依赖于国家铁塔、三大运营商和华为中兴等设备商花了十几年时间铺设的4G/5G基建网络。

同样的道理。只有当你在未来某一天,每个月只需花十几块钱(或者干脆通过看几条广告来抵消),就能毫无压力、随心所欲地让AI为你生成属于你的游戏、你的电影、你的虚拟伴侣,让你玩上整整一个月AI应用的时候,AI,才能真正走进普通人的生活。

在此之前,所有的AI C端应用,都只是在黑夜中摸索的探路者;所有的现存APP,都在抖音确立的非AI时代最高效的流量榨取模型中,做着不可逾越的困兽之斗。

抖音是非AI时代的绝唱。它把“分发与传输”这条路走到了尽头,走到了完美,走到了无可附加的巅峰。现在,旧的时代已经落幕,新的基建正在破土。面对那浩瀚但依然昂贵的AI星辰大海,我们唯一需要做的,就是保持耐心,等待算力如水滴般落入凡尘,等待那个真正的、属于AI时代的“全民狂欢”大周期的到来。

本文由 @王浩日记 原创发布于人人都是产品经理。未经作者许可,禁止转载

题图来自作者提供,由AI生成

更多精彩内容,请关注人人都是产品经理微信公众号或下载App
评论
评论请登录
  1. 目前还没评论,等你发挥!