Verónica Bolón-Canedo *, Laura Morán-Fernández, Brais Cancela, Amparo Alonso-BetanzosCITIC, Universidade da Coruña, 拉科鲁尼亚, 西班牙
文章信息
关键字:
绿色机器学习 可持续性 Green-by AI 绿色人工智能
抽象
绿色人工智能 (AI) 比传统人工智能更环保、更具包容性,因为它不仅可以在不增加计算成本的情况下产生准确的结果,还可以确保任何拥有笔记本电脑的研究人员都可以进行高质量的研究,而无需昂贵的云服务器。本文讨论了绿色 AI 作为增强 AI 系统环境可持续性的关键方法。描述了其他领域环保实践的 AI 解决方案 (green-by AI)、设计节能机器学习 (ML) 算法和模型的策略 (green-in AI),以及用于准确测量和优化能源消耗的工具。此外,还研究了法规在促进绿色 AI 方面的作用以及可持续 ML 的未来方向。强调使 AI 实践与环境因素保持一致的重要性,为 AI 系统创造一个更具生态意识和能源效率的未来。
1. 引言
在过去的几年里,人工智能 (AI) 和机器学习 (ML) 为众多行业带来了一场革命,大大提高了医疗保健、金融、交通、教育、娱乐等行业的效率和准确性。为了实现更好的性能,ML 模型必须变得越来越复杂,导致需要估计的参数数量更多。然而,这些进步是有代价的,因为训练和运行这些模型的资源需求已经显著增加。如图 1,1 所示,训练现代 ML 模型需要大量的计算资源,以及用于冷藏容纳大量训练数据的数据中心的能源和水。
随着这种颠覆性技术对环境的影响几乎呈指数级增长,对其碳足迹的严重担忧导致了一种称为绿色 AI 的新范式,该范式在模型设计、训练和部署中结合了可持续实践和技术,旨在降低相关的环境成本和碳足迹。
2022 年按选定的机器学习模型和实际示例划分的 CO2 等效排放量(吨)
图 1.用于训练 ML 模型(蓝色)和真实案例(紫色)的 CO2 当量排放量。括号中表示针对每个模型调整的数十亿个参数。
传统的 ML 算法通常需要大量的数据和计算能力,导致算法消耗大量能源,冷藏保存训练数据的数据中心需要耗水,并增加温室气体 (GHG) 排放。Green AI 旨在通过优化算法、提高硬件效率和采用可持续的数据管理实践来减轻其对环境的影响。Green AI 通过云中心和移动/边缘设备提供节能解决方案,其特点是碳足迹低、数据质量更高、模型小、计算复杂性低和逻辑透明。为了确保人们的信任,它还提供清晰和合乎逻辑的决策过程,从而增加了社会可持续性作为进一步的优势。
AI 与不断增加的经济成本有关,这意味着大多数关键的 ML 开发都掌握在拥有必要的大量资源、经济、人力和计算资源的大公司手中。无花果。 2^(5)2^{5} 显示了训练现代 ML 模型的经济成本,例如,2019 年使用 15 亿个参数训练的 GPT-2 估计成本为 50,000 美元,而 2022 年使用 5400 亿个参数训练的 PaLM 成本为 800 万美元;因此,PaLM 大 360 倍,贵 160 倍。
根据现有文献 [2],绿色算法通常被定义为“能够最大限度地提高 AI 模型的能源效率并减少对环境的影响,同时支持使用该技术来应对不同的环境挑战”的算法。因此,指的是两种类型的算法:设计绿色的算法,即在训练和使用中都节能的算法,以及专门训练和用于应对环境挑战的算法(如在关于气候变化的巴黎协定、联合国可持续发展目标 (SDG) ^(6){ }^{6} 和最近的欧洲绿色协议 ^(7){ }^{7} 中所描述的)。这些系统通常分别被称为 green-in AI 和 green-by AI。
精选大型语言和多模态模型的估计训练成本 来源:Al Index,2022 年 |图:2023 年 Al 指数报告
图 2.大型语言和多模态模型的估计训练成本。这些颜色指示估计值是高、中级还是低级。
图 3.green-in 与 green-by 算法概述。
ML 技术可用于预测可再生能源的生产,这对于无缝集成到电网中至关重要。可再生能源的可变性对可靠的能源生产构成了挑战,促使对可再生能源预测的研究。太阳能和风能的准确预测对于提高服务质量和优化电力管理至关重要 [5]。深度神经网络 (NN) 是应用最广泛的风能预测方法之一 [6-8],而混合方法通常用于太阳能预测,通常结合了深度 NN、递归 NN 和长短期记忆网络 [9-11]。在这些模型中,利用实时数据并分析历史数据和物理模型的输出,鉴于智能电网的复杂性、开发过程中的不确定性以及收集的大量实时数据,成功的开发在很大程度上依赖于 AI 支持的工具。