AI 数据中心的未来:Kelley Mullick 博士谈基础设施、液体冷却和可持续性
快速阅读: 据《IBTimes (英文)》称,凯莉·马利克博士是人工智能基础设施领域的权威,专注于数据中心设计与液体冷却解决方案。她强调,为支持AI发展需全面改造基础设施,液体冷却可显著降低运营成本与能耗。作为OCP主席,她推动行业标准制定,助力AI驱动的数据中心高效、可持续发展。
随着人工智能逐渐渗透到各个领域,支撑其发展的基础设施正面临一个紧迫的挑战:满足人工智能驱动工作负载的巨大功率和冷却需求。在这场变革的前沿,是凯莉·马利克博士,她是Avayla咨询公司的创始人兼首席执行官,该公司专注于人工智能数据中心的设计、液体冷却解决方案以及云计算基础设施的优化。拥有近二十年横跨超大规模企业和边缘行业的丰富经验,并经营着自己的咨询公司,马利克博士已成为人工智能基础设施领域的权威专家,她成功地弥合了尖端技术与商业战略之间的鸿沟。
“为了让人工智能实现规模化应用,我们需要从根本上改变数据中心的构建方式,”马利克博士表示,“液体冷却是这一方程的重要组成部分,但这只是其中的一环。我们正在谈论的是对整个基础设施进行全面改造,以支持下一代计算。”
人工智能模型在复杂性和规模上呈现出指数级的增长。最新一代用于驱动这些模型的GPU所需的热设计功耗(TDP)远远超过了传统风冷所能支持的水平。“目前,世界上大多数数据中心依然依赖风冷,”马利克博士解释道,“但人工智能已经将热需求推到了风冷无法应对的程度。我们看到许多公司正在努力适应这种变化,但如果缺乏适当的基础设施,人工智能集群可能会面临效率低下、过热和不稳定的风险。”
扩展人工智能需要在多个机架之间共享计算资源,这与传统工作负载不同,后者每个机架独立运行。这一转变意味着数据中心的冷却和网络必须从头开始重新构想。马利克博士一直是数据中心采用液体冷却技术的先驱,特别是在她为超大规模客户工作的过程中。她领导了浸没式冷却的保修策略,并开发了行业首创的总拥有成本(TCO)模型,展示了液体冷却的经济优势。
“行业内许多人认为直接到芯片的冷却是唯一答案。虽然这是一种成熟的技术,但浸没式冷却和两相技术也在不断发展,”她说,“我们将看到一个混合的未来,多种冷却解决方案协同工作以满足人工智能不断增长的需求。”
尽管液体冷却具有明显的优势,但其采用速度仍然缓慢,不是因为技术障碍,而是因为企业优先考虑总拥有成本(TCO)模式和运营成本而不是可持续性。然而,马利克博士认为液体冷却既能带来经济效益又能带来环境效益。“改用液体冷却可以将数据中心的运营成本削减高达40%,”她说,“这对人工智能驱动的电力消耗迫使公司重新思考能源战略,包括核能和替代能源来说是一个改变游戏规则的因素。”
此外,液体冷却大幅减少了水资源消耗,在水资源短缺的地区这是一个关键优势。“在像亚利桑那州或中东这样的地方,水是非常宝贵的,减少对传统冷却方法的依赖似乎是这个转变中最合理的部分,”马利克博士指出,同时强调了这一转型的可持续性方面。
除了她的技术成就,马利克博士还是技术领域多样化的有力倡导者,并在推动液体冷却技术标准方面发挥了重要作用。她被评为2024年、2023年《技术领域50位女性领导者》、《关键任务杂志》2024年的《技术领域25位女性》以及《我们钦佩的女人》出版的2023年《技术领域顶尖女性领导者》。这位发明家参与开发了一种利用人工智能培训优先处理和解决客户投诉的专利软件系统,创造了约6000万美元的新收入来源。凭借多项专利和开创性工作,她已在显著减少尾部延迟并大幅提升云基础设施吞吐量方面取得重要成果,马利克博士独特地处于引导行业迈向高性能、可持续性和成本效率成为常态未来的地位。
担任开放计算项目(OCP)行业联络小组主席,她正积极与超大规模企业及行业领袖合作,制定定义下一代数据中心的标准。“目前最大的挑战是让基础设施快速扩展以满足人工智能的需求,”她说,“我们看到超大规模企业在扩展时遇到了稳定性问题。人工智能基础设施必须超越今天的假设而进化。”
她即将在OCP都柏林活动上的演讲将进一步巩固其在人工智能驱动的数据中心演进中的思想领袖地位。随着人工智能重塑行业,数据中心行业也必须同样迅速地行动。马利克博士的见解清楚地表明:今天投资于下一代人工智能基础设施的公司将引领明天。
(以上内容均由Ai生成)