AI基础设施面临热管理与能耗挑战,xFusion提出解决方案

发布时间:2025年11月4日    来源:szf
AI基础设施面临热管理与能耗挑战,xFusion提出解决方案

快速阅读: 企业与超大规模公司正向AI基础设施投入巨资,但面临硬件挑战导致投资回报难以保障。xFusion提出整体策略,通过材料科学和热管理创新,解决数据中心能耗和热管理问题,推出FusionPoD全液冷服务器机柜,实现高效冷却与能效。

企业与超大规模公司正向人工智能基础设施投入数十亿美元,但投资回报却无法保证。原因在于未解决且根本性的硬件挑战,这些挑战可能在这些AI工厂达到全面生产之前就将其摧毁。昂贵而复杂的图形处理器(GPU)如果不能充分利用,其价值将大打折扣。确保GPU持续获得数据供应,引发了关于服务器、集群及整个数据中心内部互联基础设施的关键问题。

智能计算推动了AI的突破——点击放大

此外,GPU极其耗能。单个高端单元的电力消耗相当于普通家庭的用电量,同时产生大量需要迅速排出的热量。对于新一代的AI和高性能计算(HPC)设施而言,传统的空气冷却方案已无法满足需求。据KPMG预测,新的数据中心将依赖液体冷却技术,但这会带来自身的复杂性,并可能导致能源需求进一步增加。问题的规模令人震惊。国际能源署发现,数据中心目前占全球总电力消耗的1.5%,预计到2030年将成为需求增长的主要驱动力。这些严峻的挑战引起了政府和监管机构的高度关注。

在迪拜举行的2025年GITEX全球大会上,总部位于新加坡的计算基础设施和解决方案提供商xFusion指出,解决这些问题需要一种构建核心数据中心硬件的整体策略——该策略需考虑热管理、能耗和数据连接方面的基本物理原理。这一理念是xFusion所谓的“黑科技”的基础,它是一系列从材料科学、热力学到高速信号传输的深层次创新,旨在从零开始设计。

超越组件的策略

这一策略不仅仅是最佳组件的清单。通过协同工程专有材料与定制组件,如微通道冷板和浸没式电源,xFusion消除了仅组装现成部件时产生的性能瓶颈。其结果是一个整体大于部分之和的系统,在大规模上提供可预测的性能和可靠性。

这种方法使得xFusion的FusionPoD,一款全液冷服务器机柜,能够通过直接液体冷却实现1500瓦的冷却性能。创新包括热导率翻倍的热界面材料和散热效率提高10%的液体冷却剂。这些与性能提升25%的微通道冷板和比竞争对手表现高出50%的散热器相结合。其结果是,通过集中式CDU和液体冷却,FusionPoD实现了低于1.06的实测pPUE,远低于Uptime Institute在2024年识别的全球平均数据中心PUE 1.56,甚至优于Google尖端数据中心机群的1.09平均值。这种性能还为未来更强大、更热的GPU,如NVIDIA未来路线图上的1千瓦机架,留出了关键的空间。

FusionPoD适用于AI——点击放大

材料创新也融入了xFusion的高速互连设计中,旨在通过PCIe 5.0/6.0解决数据瓶颈问题。利用专有的LSNR SI/PI建模,xFusion为任何芯片平台创建了优化的定制PCB。自定义高密度连接器减少了信号路径,提供了10%更高的I/O密度和双倍功率,封装尺寸缩小30%。

至关重要的是,互连在接口级别遵循开放标准,确保客户可以无缝集成xFusion的服务器到现有的多供应商环境中。这是运营商在寻求更好地利用GPU资源并考虑新硅供应商时的一个关键问题。

定制电源单元完善了这一画面。xFusion的3千瓦钛金电源单元达到了96.2%的效率,与标准铂金电源单元相比,单个单位在五年内可节省超过1400千瓦时的电力。该公司还推出了一款可热插拔的模块化液冷电源单元,支持并行安装多达36个单元,这对于推理工作负载所需的更高电源弹性至关重要。

这些工程成果体现在FusionPoD系列中,该系列为AI、HPC和云计算工作负载提供高密度GPU计算,并具备全原生液冷功能。其创新的无电缆机柜设计采用了三总线系统(电源、网络和液冷),最多支持64个GPU或144个CPU。

在GITEX上,xFusion展示了其数据中心产品,尽管行业普遍面临电力挑战。为应对这一问题,公司推出了新平台,以进一步支持其“计算+能源”生态系统。这包括用于高端模拟的X3 8000智能工作站及其FusionWatt智能能源组合,后者适用于商业储能等应用,所有这些都采用了相同的技术DNA,旨在降低能耗并提高稳定性。

面对恶劣环境

在GITEX的技术论坛上,xFusion阐述了其产品战略如何直接应对企业和超大规模数据中心面临的挑战。这些挑战不仅涉及功耗和计算能力,还包括长期存在的业务问题,如GPU访问、土地和电力供应。

电力韧性至关重要;模型训练中断虽不便,但AI驱动的医疗系统停摆则是生死攸关。同样,在地缘政治不确定的环境下,数字主权和安全成为关键。

这些挑战在中东尤为突出。据普华永道的研究显示,该地区拥有相对廉价的电力和土地资源,但也面临着将电力供应与具体项目对接的难题。其极端气候和水资源紧张,使得热管理更加困难。

因此,xFusion在迪拜和利雅得设立了枢纽,致力于支持沙特阿拉伯的2030愿景,该愿景设定了雄心勃勃的目标,旨在转型可再生能源、先进制造、医疗保健、汽车和航空航天等关键领域。

这些目标的实现需要对高性能计算(HPC)和人工智能(AI)基础设施进行重大投资。但这意味着要解决环境挑战,如极端温度和水资源压力,以及人员短缺和安全风险增加等社会问题。所有这些问题都需要xFusion所带来对基础技术的关注。

xFusion在其设计理念方面进行了实地测试,客户之一是阿尔及利亚的石油天然气地球物理公司ENAGEO。ENAGEO需要能够在撒哈拉沙漠55°C高温下稳定运行的数据中心容量,以分析偏远地震区的大数据。通过采用FusionServer架构和xFusion的冷却技术,并结合其AI内存自愈工具,ENAGEO将停机时间减少了三分之二。在如此偏远的地点,这是一个巨大的成就。

从幕后到台前

AI和HPC有望改变世界,但xFusion认为,可持续发展意味着尊重数据中心的基本物理规律。虽然这是xFusion第三次参加GITEX,但今年它走出了幕后,强调其全球研发中心网络。其信息明确:关键机遇不仅在于使AI成为可能,还在于使其经济和环境上可持续。这纯粹是一个基础设施挑战。

xFusion赞助。

(以上内容均由Ai生成)

你可能还想读

AI摄影新趋势:普通车照变专业级长曝光大片

AI摄影新趋势:普通车照变专业级长曝光大片

快速阅读: 新的AI摄影提示在社交媒体上流行,将普通汽车照片转化为长曝光效果,如同高端佳能单反所摄,带来电影般的光泽和专业照明,无需摄影设备,效果逼真,深受用户喜爱。 一种新的AI摄影提示正在社交媒体上风靡一时,它将普通的汽车照片转化为令人 […]

发布时间:2025年11月4日
帕拉迪恩AI获美国专利,实现异构群智能协作

帕拉迪恩AI获美国专利,实现异构群智能协作

快速阅读: 帕拉迪恩人工智能获美国专利12,452,957 B2,实现异构传感器网络的闭环任务分配与控制,支持多类型自主系统高效协作,即使在受限环境中也能提供稳健性能。 帕拉迪恩人工智能公司(纳斯达克股票代码:PDYN 和 PDYNW)今日 […]

发布时间:2025年11月4日
AI加速加密骗局,行业需构建内置韧性

AI加速加密骗局,行业需构建内置韧性

快速阅读: 丹诺·科恩指出2025年加密货币面临重大风险,AI加速诈骗,去年欺诈损失达99亿美元,需从修补转向内置韧性,加强实时防御。 丹诺·科恩,Kerberus的联合创始人兼首席技术官发表观点称,2025年加密货币风险如同洪流般涌现。人 […]

发布时间:2025年11月4日
亚马逊与OpenAI达成330亿欧元云服务协议,股价创历史新高

亚马逊与OpenAI达成330亿欧元云服务协议,股价创历史新高

快速阅读: 亚马逊与OpenAI达成330亿欧元云计算协议,股价创历史新高,市值增至2.4万亿欧元。协议显示AWS计算能力获高度认可,助力OpenAI发展。 亚马逊股价在与OpenAI达成330亿欧元云计算协议后创历史新高,据雨果·邓肯报道 […]

发布时间:2025年11月4日
帕兰蒂尔市值激增160亿美元,AI热潮持续升温

帕兰蒂尔市值激增160亿美元,AI热潮持续升温

快速阅读: Palantir Technologies因强劲财报市值激增160亿美元至近5000亿美元,商业收入增长121%,超越政府业务,成企业AI基础设施领导者,但高估值引发谨慎。 华尔街对人工智能(AI)的热情丝毫未减,而Palant […]

发布时间:2025年11月4日
OpenAI与AWS签署380亿美元云计算协议

OpenAI与AWS签署380亿美元云计算协议

快速阅读: OpenAI与亚马逊AWS签署380亿美元协议,获数十万英伟达GPU及数千万CPU,支持AI发展,计划2026年前全面投入使用,加速AI生态系统建设。 OpenAI,ChatGPT的开发者,周一与亚马逊的AWS云计算部门签署了一 […]

发布时间:2025年11月4日
创企Quickads获170万美元融资,加速企业市场扩展

创企Quickads获170万美元融资,加速企业市场扩展

快速阅读: 生成式AI公司Quickads获170万美元融资,由Kae Capital领投,谷歌和Meta参与。公司将加速企业市场扩张,提供全栈内容及用户行为分析,旨在将营销科学化,提高效率。 生成式AI初创公司Quickads近日完成了由 […]

发布时间:2025年11月4日
认知公司部署Anthropic的Claude,加速企业AI应用

认知公司部署Anthropic的Claude,加速企业AI应用

快速阅读: 认知公司采用安斯帕姆的克劳德模型,助力企业AI大规模部署,计划覆盖35万员工,整合克劳德代码与Flowsource平台,加速软件开发和代码重构,推动AI系统与人协作,提升安全性与合规性。 认知公司(Cognizant)已采用安斯 […]

发布时间:2025年11月4日