ChatGPT 们难以复制的原因，除了耗显卡，还有水电费太贵？

搜索

APP

起点课堂会员权益

职业体系课特权

线下行业大会特权

个人IP打造特权

30+门专项技能课

1300+专题课程

12场职场软技能直播

12场求职辅导直播

12场专业技能直播

会员专属社群

荣耀标识

发布

ChatGPT 们难以复制的原因，除了耗显卡，还有水电费太贵？

爱范儿

2023-04-18

0 评论 2881 浏览 0 收藏

12 分钟

最近，出现了新的对于ChatGPT 研究，比如AI 耗电、排碳等，并非是在谴责或反对发展 AIGC 用资源去换取技术的改进。现如今AI能发展到如何，谁也说不准，但它有着无限的发展可能，需要我们去不断的探索。本篇文章推荐给对AI感兴趣的童鞋们阅读。

一觉醒来，世界又变了。

ChatGPT 走入大众视野之后，AIGC 行业迎来了爆发，尤其是上个月，仿佛每一天都可能是「历史性」的一天。

以 ChatGPT 为代表的生成式 AI，看似超前，但却以一种极其「古典」的交互形式出现在大众面前。

它没有花里胡哨的图标，也没有深入人心的 UI 设计，而是用最简单的对话框来「震撼」世界。

不过，如此简单的形式，却成为了当下网络上和现实里最火热的话题，果然「好看的皮囊千篇一律，有趣的灵魂万里挑一」。

只是存在于一个个 web 网页，一条条简单的问答中，往往会让我们忽略不少问题。

看似毫无负担的一个个「回答」，背后却用着世界上屈指可数的云算力。

随着 ChatGPT 成为常态，隐藏在 ChatGPT 们背后的这些角落也逐步被报道出来。

01 烧钱费电，还喜欢喝水

生成式 AI 耗费显卡这种情况，有些类似于「挖矿」。

对大语言模型（LLMs）进行训练，参数越多，性能越好。2018 年的 LLM 大约有 1 亿个参数，而到了现在，大约就要对 2000 亿个参数进行训练。

运行他们需要算力更强的 GPU，英伟达也在 2020 年推出了相对应的 A100 高性能 GPU，并且也可以打包八张 A100 形成 DGX A100 服务器。

这些计算服务器，或者说显卡组，最终被安放在所谓的云计算中心，比如说微软的就是 Azure 云服务。

不光训练大语言模型需要大量算力，当每个用户请求一次，ChatGPT 们回答一次，都要调用部分算力。

流量就是金钱，我想 OpenAI、微软应该有刻骨铭心的体会。

根据 Similarweb 的数据，上个月 ChatGPT 吸引了全球 16 亿次访问，是一月时的近三倍。

这种情况下，即便微软有所准备，给 ChatGPT 准备了一万多张 A100，但面对如此的流量，OpenAI 还是坚持不住了，出现了宕机、封号和暂停 Plus 会员的开通。

有人做过预估，想要吃下当下的流量，微软还得买几万张 A100、H100 显卡，Azure 现在的算力远远不够。

但买更多的显卡，除了烧钱，也会衍生出许多问题。

八张 A100 组成的 DGX A100 服务器大概售价 19.9 万美元，最高功率为 6.5kW。

按照一万张来算的话，光在硬件上微软就要花去 2.5 亿美元，运行一个月就要用掉 585 万度电。

而按照国家统计局公开的数据，我国居民月度用电量大约是 69.3 度。ChatGPT 运行一月，大概与我们 8 万人用电相当。

除了显卡本身的价值，以及维持他们工作所需的电能外，给他们创造一个凉爽的环境，配置一套蒸发冷却装置。

原理也比较简单，就是利用蒸发水来散热，但运行起来需要消耗大量的清水，并且在循环的过程里，大概会有 1%～2% 的水会作为细水雾被风吹走。

虽然站在宏观角度，水仍然维持着动态平衡，但在冷却塔的小环境中，却是一种无形的消耗。

结合 AIGC 需要庞大算力的计算中心，卡罗拉多大学与德克萨斯大学的研究人员就在论文里预估了在训练过程中所消耗的清水。

以 GPT-3 为例，训练过程中所需的清洁淡水相当于填满核反应堆冷却塔所需的水量。果然 AI 最终还是要跟核电挂上钩。

如果再具体点，则大约消耗了 70 万升，并且他们还算出，一个用户与 ChatGPT 进行 25～50 个问题的对话，大概就相当于请 ChatGPT 喝了 500ml 水。