因果关系:现在应该计算 AI 的环境成本
快速阅读: 《印度斯坦时报》消息,凯特·克劳福德在《AI地图集》中指出,人工智能的生产和使用涉及大量自然资源和人力劳动。《AI系统的解剖学》项目揭示了设备从制造到废弃的整个生命周期对环境的影响。专家表示,AI的能耗巨大,训练大型模型会导致显著碳排放和水资源消耗。尽管一些公司承诺减排,但实际进展缓慢,数据中心的能源和水资源需求仍在迅速增加。
凯特·克劳福德在她的著作《AI地图集》的引言中写道:“……人工智能既是具身的,又是物质的,由自然资源、燃料、人力劳动、基础设施、物流、历史和分类构成。”量化低收入和中等收入国家中雇员的人力劳动是一项艰巨任务,即便是政府也难以准确反映这些人的数量及其在蓝领工作中的贡献。那么,或许我们可以看看技术是如何运作的?《AI系统的解剖学》是凯特·克劳福德和弗拉丹·约勒尔共同制作的一个信息图和研究项目,该项目探讨了一台设备从制造到废弃的整个生命周期中所需的人力劳动、数据和资源。该图表展示了设备对全球的影响,从提取建造设备所需的金属到产生的环境影响,再到设备收集用户个人数据的过程。(凯特·克劳福德和弗拉丹·约勒尔)
与任何数字技术一样,人工智能的生命周期可以大致分为硬件和软件两个阶段。硬件阶段始于制造过程,包括原材料提取、组件生产(处理器、内存、存储)、人工智能硬件组装、数据中心安装以及电力和冷却基础设施的设置。软件生命周期则始于数据收集、模型开发、初始训练和测试验证,之后才能部署使用。
接下来的问题是:这如何对环境造成危害?关于这个问题的信息非常有限。将一个问题输入Anthropic的大语言模型(LLM)Claude,得到的回答如下:“由于我是一个运行在由Anthropic控制的计算机上的软件系统,因此不会直接对气候产生物理影响。”
进一步追问后,聊天机器人回应如下:“训练阶段:模型训练需要高能耗(范围从数百到数百万千瓦时);计算硬件生产影响(稀有金属、制造排放);数据中心冷却需求;部署/推理阶段:基础设施维护和更换、网络传输能源成本;报废阶段:退役硬件产生的电子垃圾;显著影响因素包括:模型大小和架构、电网碳强度、硬件效率和部署规模。”最后附带了一个注释,直观地指出了公司不同AI模型之间的差异,建议查看他们自己的报告。
这就引出了问题:实际消耗了多少能源?公平地说,从设备生产到处理云查询的数据中心,数字技术的生命周期与任何其他人类活动一样耗能巨大。联合国环境规划署在2024年估计,制造一台重2公斤的电脑需要大约800公斤的原材料;微芯片需要通过破坏性方式开采的稀土金属;数据中心会产生如汞和铅之类的电子垃圾;数据中心建设和冷却电气组件一旦投入运营就需要用水。
事实上,根据Lotfi Belkhir和Ahmed Elmeligi的估算,科技行业预计将在2040年贡献全球温室气体排放量的14%,而瑞典的一个团队预测,到2030年,数据中心的电力需求将增加约15倍。然而,一些独立的估算表明气候成本存在不同程度的变化。
“一次ChatGPT查询使用的电量相当于点亮一盏灯20分钟的电量。”艾伦人工智能研究所的高级研究员杰西·多奇在接受NPR采访时说。“所以,你可以想象,如果每天有数百万人使用这样的服务,那将累积成一个巨大的电量消耗。”他说。
这些统计数据并不是要将AI定位为这场技术故事中的唯一反派:即使是一次谷歌搜索也会消耗能量。但是,作为对比,高盛的一份报告显示,OpenAI的生成式聊天机器人ChatGPT使用的能量是谷歌搜索的10倍。
那么,不同的AI模型在能源利用和后续影响上有什么区别呢?专家坚持认为,精确计算AI对气候危机的实际影响是一项艰巨的任务,尤其是在缺乏这些模型所有者透明度的情况下。主要原因在于,不同类型的人工智能——无论是用于识别研究数据趋势的机器学习模型,还是使聊天机器人能够对话的大语言模型(LLM)——都需要不同的计算能力来训练和运行。例如,训练GPT-3导致了相当于552吨二氧化碳的碳排放,并消耗了1287兆瓦时的能量,论文《大型神经网络训练的碳排放》发现。这相当于超过4500个往返德里和钦奈之间的航班所产生的排放量。谷歌航班估算显示,两个城市之间一个直飞航班的乘客产生的直接往返排放量为0.117吨二氧化碳当量。
此外,数据中心的水需求预计将比丹麦的消费量高出六倍。数据中心使用的是淡水而不是地表水,以防止用于冷却服务器机架的管道、泵和热交换器因污染物堵塞。德克萨斯州水资源管理专家文卡特什·乌达梅里博士表示,一个典型的数据中心每天可以使用1100万至1900万升水,大约相当于一个3万到5万人的城镇的用水量。微软在其最初的AI工具开发过程中,其全球用水量增加了34%,而在爱荷华州的一个数据中心集群在训练OpenAI的GPT-4期间,一个月内就使用了该地区6%的供水。
因此,专家建议从多角度看待AI对气候的影响。在缺乏关于AI环境影响可靠信息的真空环境中,社交媒体上出现了大量新闻报道,谴责新兴技术加剧了危机。但这种真空状态同样反映了对大型科技公司的普遍不信任。尽管如此,专家们指出,AI变绿的潜力尚未被充分利用:数据中心可以使用可再生能源,芯片设计正变得越来越节能,AI算法也有潜力更高效、更快速地运行。然而,这一发展始终未能跟上AI革命的步伐。例如,承诺在2030年前实现碳中和的微软公司在2023年由于数据中心的增长,其排放量增加了近30%。此外,各地区的差异也很大。联合国大学的一篇文章称,2022年,谷歌在北欧地区基于可再生能源运行其数据中心的时间超过90%,而在亚洲地区,这一比例下降到不足20%。地方工业法规对此差异有所贡献。虽然大多数从事AI工作的公司都不披露其排放情况,但谷歌在其去年发布的可持续发展报告中表示,自2019年以来,其温室气体排放量增加了48%,主要归因于数据中心的能源消耗和供应链排放。“随着我们将AI进一步整合到我们的产品中,减少排放可能会面临挑战。”报告中写道。
微软在其自己的报告中表示,自2020年以来,由于建设更多支持AI工作负载的数据中心,其排放量增长了29%。为了说明问题,目前全球有超过8000个数据中心,这个数字自2015年以来几乎翻了一番。这些数据中心现在消耗的电力相当于整个意大利的用电量。而且这还不止于此。随着AI更加普及和AI工具变得更加复杂,能源需求只会增加。据彭博社分析,瑞典在未来十年内的数据中心电力需求可能翻一番,到2040年再翻一番。如果这些数据中心全年不间断运行,其总耗电量将达到508太瓦时,超过意大利或澳大利亚全年的发电量。到2034年,全球数据中心的能源消耗预计将达到1580太瓦时,相当于印度全年的用电量。在英国,AI在未来十年内预计会消耗500%更多的能源。而据高盛预测,在美国,到2030年,数据中心将占总电力消耗的8%,高于2022年的3%,这被描述为“一代人未曾见过的电力增长”。
初步数据显示,专家们的担忧也是存在的。但如果有经验可循,科技公司可能会事后才采取行动。随着气温升高,事后反思的时间窗口可能已经过去。
(以上内容均由Ai生成)