虚拟化如何为企业 AI 提供能源效率
快速阅读: 据《数据中心动态》称,多家科技巨头正确保AI能源供应稳定。本地化数据中心部署AI任务,能显著提升效率、降低成本及能耗。虚拟化技术助力AI任务负载优化,集中IT管理强化控制与安全性,帮助企业更高效利用资源。
在过去几个月里,亚马逊、谷歌、Meta 以及微软均宣布了确保其人工智能努力能够可靠访问能源来源的计划。人工智能对能源的需求已经引起白宫椭圆办公室的关注,无论是拜登还是特朗普政府都将此视为优先事项,并承诺支持需要大量能源的人工智能基础设施建设。
好消息是,一种人工智能能源“解决方案”已经存在。这一方案并非基于云端,而是本地化的,位于我们自己的数据中心。一切都与数据有关,其实很简单。运行任何计算模型或执行任何任务负载的最高效方法就是将其部署在数据所在的地方。大多数企业已经采取了这样的做法。他们已经在自己的数据中心内运行自己的任务负载,这是他们最敏感的专有数据存放之处。挖掘和利用这些数据的最佳和最有效的方式就是在数据所在的地方运行这些任务负载。
早期的人工智能模型部署在云端。为了参与其中的开发,企业必须将数据移动到云端以接近这些模型。但企业应该反其道而行之:他们应该将人工智能模型部署在本地环境,以最安全、最节能和最具成本效益的方式利用他们的数据。即使组织更倾向于利用云计算的弹性来进行模型训练或微调,将这些模型在本地靠近数据的地方运行也更为高效,这可以显著节省成本和能源。运行任何计算模型或执行任何任务负载的最高效方法就是将其部署在数据所在的地方。
虚拟化与能源效率
与其移动数据并将数据分散或不必要的移动到不同的计算资源或将数据移至超大规模云服务之一,不如在数据已经创建、处理或消费的地方运行该人工智能任务负载要高效的多。这就是所谓的私有人工智能,它为企业IT提供了许多优势,包括能源效率。私有人工智能使企业能够充分利用当前数据中心基础设施所依赖的虚拟化堆栈。虚拟化帮助企业在几十年间实现了能源效率。虚拟化通过将任务负载整合到更少的服务器上减少了硬件占用空间,并由此消耗更少的电力。这一直是虚拟化的主要优势之一,也是为什么今天大多数企业任务负载都在虚拟化堆栈上运行的原因。组织报告称,由于减少了运行IT服务所需的硬件和软件,基础设施成本平均降低了49%。
与其移动数据并将数据分散或不必要的移动到不同的计算资源或将数据移至超大规模云服务之一,不如在数据已经创建、处理或消费的地方运行该人工智能任务负载要高效的多。这就是所谓的私有人工智能,它为企业IT提供了许多优势,包括能源效率。虚拟化为人工智能任务负载带来了相同的能源效率优势,可以说在人工智能任务负载中这些优势更为重要。人工智能任务负载依赖于计算加速器,如GPU。它们可以被优化,就像CPU和内存资源一样,虚拟化允许GPU被优化并整合到更少的物理服务器和更小的整体硬件足迹上。结果是消耗更少的电力,同时提供相同的人工智能计算能力。智能地汇集和共享GPU及相关人工智能基础设施(例如网络、存储和内存资源)可以减少运行各种人工智能/机器学习服务所需的总硬件基础设施,从而进一步提高能源效率。最重要的是,这些好处可以在不牺牲性能的情况下实现。
虚拟化为人工智能任务负载带来了相同的能源效率优势,可以说在人工智能任务负载中这些优势更为重要。人工智能任务负载依赖于计算加速器,如GPU。它们可以被优化,就像CPU和内存资源一样,虚拟化允许GPU被优化并整合到更少的物理服务器和更小的整体硬件足迹上。集中化的组织控制
采用私有人工智能方法的企业还有一个额外的优势,即有一个集中的IT团队管理和分发企业的其他部门的人工智能能力。这为企业提供了对其所有人工智能资源的组织控制。这种集中控制确保了各个业务部门不会在其自身组织内建立分散的人工智能集群或服务器。此外,组织可以通过确保只有经过中央IT审查和批准的模型才能投入生产来降低风险。私有人工智能的好处
采用私有人工智能方法的企业还有一个额外的优势,即有一个集中的IT团队管理和分发企业的其他部门的人工智能能力。这为企业提供了对其所有人工智能资源的组织控制。这种集中控制确保了各个业务部门不会在其自身组织内建立分散的人工智能集群或服务器。此外,组织可以通过确保只有经过中央IT审查和批准的模型才能投入生产来降低风险。
能够像企业一直以来所做的那样整合人工智能并管理人工智能资源,使得部署人工智能模型的速度更加符合组织的需求变得更加容易。GPU 是人工智能任务负载不可或缺的核心技术,而大多数数据中心尚未配备运行非常大量的 GPU 的能力。私有人工智能确保企业尽可能高效地利用它。采用私有人工智能方法的企业还有一个额外的优势,即有一个集中的IT团队管理和分发企业的其他部门的人工智能能力。这为企业提供了对其所有人工智能资源的组织控制。这种集中控制确保了各个业务部门不会在其自身组织内建立分散的人工智能集群或服务器。此外,组织可以通过确保只有经过中央IT审查和批准的模型才能投入生产来降低风险。
虚拟化还允许企业比纯粹的硬件环境更聪明、更安全、更节能地分配人工智能资源,通过启用基础设施容量的智能池化和共享。今天的大企业实际上拥有成千上万台虚拟机,这些虚拟机的利用率低于30%。当超出生成式人工智能范畴时,许多人工智能/机器学习服务可以在现有的CPU容量上有效运行,这可以进一步降低成本和能源消耗。
对于正在考虑其人工智能部署的企业来说,软件定义的虚拟化私有人工智能方法提供了能效提升、硬件需求减少以及集中化操作控制等优势。虚拟化还允许企业比纯粹的硬件环境更聪明、更安全、更节能地分配人工智能资源,通过启用基础设施容量的智能池化和共享。今天的大企业实际上拥有成千上万台虚拟机,这些虚拟机的利用率低于30%。当超出生成式人工智能范畴时,许多人工智能/机器学习服务可以在现有的CPU容量上有效运行,这可以进一步降低成本和能源消耗。
更多关于人工智能与数据分析的内容
**人工智能数据中心:扩展规模与覆盖范围**
**2025年1月16日**
IBM 将在 CoreWeave 的人工智能基础设施上训练新的 Granite 模型
**亚太地区数据中心——应对可扩展性挑战**
(以上内容均由Ai生成)