AI基础设施面临热管理与能耗挑战,xFusion提出解决方案
                            快速阅读: 企业与超大规模公司正向AI基础设施投入巨资,但面临硬件挑战导致投资回报难以保障。xFusion提出整体策略,通过材料科学和热管理创新,解决数据中心能耗和热管理问题,推出FusionPoD全液冷服务器机柜,实现高效冷却与能效。
企业与超大规模公司正向人工智能基础设施投入数十亿美元,但投资回报却无法保证。原因在于未解决且根本性的硬件挑战,这些挑战可能在这些AI工厂达到全面生产之前就将其摧毁。昂贵而复杂的图形处理器(GPU)如果不能充分利用,其价值将大打折扣。确保GPU持续获得数据供应,引发了关于服务器、集群及整个数据中心内部互联基础设施的关键问题。
智能计算推动了AI的突破——点击放大
此外,GPU极其耗能。单个高端单元的电力消耗相当于普通家庭的用电量,同时产生大量需要迅速排出的热量。对于新一代的AI和高性能计算(HPC)设施而言,传统的空气冷却方案已无法满足需求。据KPMG预测,新的数据中心将依赖液体冷却技术,但这会带来自身的复杂性,并可能导致能源需求进一步增加。问题的规模令人震惊。国际能源署发现,数据中心目前占全球总电力消耗的1.5%,预计到2030年将成为需求增长的主要驱动力。这些严峻的挑战引起了政府和监管机构的高度关注。
在迪拜举行的2025年GITEX全球大会上,总部位于新加坡的计算基础设施和解决方案提供商xFusion指出,解决这些问题需要一种构建核心数据中心硬件的整体策略——该策略需考虑热管理、能耗和数据连接方面的基本物理原理。这一理念是xFusion所谓的“黑科技”的基础,它是一系列从材料科学、热力学到高速信号传输的深层次创新,旨在从零开始设计。
超越组件的策略
这一策略不仅仅是最佳组件的清单。通过协同工程专有材料与定制组件,如微通道冷板和浸没式电源,xFusion消除了仅组装现成部件时产生的性能瓶颈。其结果是一个整体大于部分之和的系统,在大规模上提供可预测的性能和可靠性。
这种方法使得xFusion的FusionPoD,一款全液冷服务器机柜,能够通过直接液体冷却实现1500瓦的冷却性能。创新包括热导率翻倍的热界面材料和散热效率提高10%的液体冷却剂。这些与性能提升25%的微通道冷板和比竞争对手表现高出50%的散热器相结合。其结果是,通过集中式CDU和液体冷却,FusionPoD实现了低于1.06的实测pPUE,远低于Uptime Institute在2024年识别的全球平均数据中心PUE 1.56,甚至优于Google尖端数据中心机群的1.09平均值。这种性能还为未来更强大、更热的GPU,如NVIDIA未来路线图上的1千瓦机架,留出了关键的空间。
FusionPoD适用于AI——点击放大
材料创新也融入了xFusion的高速互连设计中,旨在通过PCIe 5.0/6.0解决数据瓶颈问题。利用专有的LSNR SI/PI建模,xFusion为任何芯片平台创建了优化的定制PCB。自定义高密度连接器减少了信号路径,提供了10%更高的I/O密度和双倍功率,封装尺寸缩小30%。
至关重要的是,互连在接口级别遵循开放标准,确保客户可以无缝集成xFusion的服务器到现有的多供应商环境中。这是运营商在寻求更好地利用GPU资源并考虑新硅供应商时的一个关键问题。
定制电源单元完善了这一画面。xFusion的3千瓦钛金电源单元达到了96.2%的效率,与标准铂金电源单元相比,单个单位在五年内可节省超过1400千瓦时的电力。该公司还推出了一款可热插拔的模块化液冷电源单元,支持并行安装多达36个单元,这对于推理工作负载所需的更高电源弹性至关重要。
这些工程成果体现在FusionPoD系列中,该系列为AI、HPC和云计算工作负载提供高密度GPU计算,并具备全原生液冷功能。其创新的无电缆机柜设计采用了三总线系统(电源、网络和液冷),最多支持64个GPU或144个CPU。
在GITEX上,xFusion展示了其数据中心产品,尽管行业普遍面临电力挑战。为应对这一问题,公司推出了新平台,以进一步支持其“计算+能源”生态系统。这包括用于高端模拟的X3 8000智能工作站及其FusionWatt智能能源组合,后者适用于商业储能等应用,所有这些都采用了相同的技术DNA,旨在降低能耗并提高稳定性。
面对恶劣环境
在GITEX的技术论坛上,xFusion阐述了其产品战略如何直接应对企业和超大规模数据中心面临的挑战。这些挑战不仅涉及功耗和计算能力,还包括长期存在的业务问题,如GPU访问、土地和电力供应。
电力韧性至关重要;模型训练中断虽不便,但AI驱动的医疗系统停摆则是生死攸关。同样,在地缘政治不确定的环境下,数字主权和安全成为关键。
这些挑战在中东尤为突出。据普华永道的研究显示,该地区拥有相对廉价的电力和土地资源,但也面临着将电力供应与具体项目对接的难题。其极端气候和水资源紧张,使得热管理更加困难。
因此,xFusion在迪拜和利雅得设立了枢纽,致力于支持沙特阿拉伯的2030愿景,该愿景设定了雄心勃勃的目标,旨在转型可再生能源、先进制造、医疗保健、汽车和航空航天等关键领域。
这些目标的实现需要对高性能计算(HPC)和人工智能(AI)基础设施进行重大投资。但这意味着要解决环境挑战,如极端温度和水资源压力,以及人员短缺和安全风险增加等社会问题。所有这些问题都需要xFusion所带来对基础技术的关注。
xFusion在其设计理念方面进行了实地测试,客户之一是阿尔及利亚的石油天然气地球物理公司ENAGEO。ENAGEO需要能够在撒哈拉沙漠55°C高温下稳定运行的数据中心容量,以分析偏远地震区的大数据。通过采用FusionServer架构和xFusion的冷却技术,并结合其AI内存自愈工具,ENAGEO将停机时间减少了三分之二。在如此偏远的地点,这是一个巨大的成就。
从幕后到台前
AI和HPC有望改变世界,但xFusion认为,可持续发展意味着尊重数据中心的基本物理规律。虽然这是xFusion第三次参加GITEX,但今年它走出了幕后,强调其全球研发中心网络。其信息明确:关键机遇不仅在于使AI成为可能,还在于使其经济和环境上可持续。这纯粹是一个基础设施挑战。
xFusion赞助。
(以上内容均由Ai生成)