Dell 和 NVIDIA 的 AI Factory 2.0 能否解决企业级 AI 基础架构的差距?
快速阅读: 《Futurum 研究》消息,戴尔与英伟达联合推出新一代AI工厂,涵盖新款PowerEdge服务器、增强的数据管理工具及托管服务,支持AI全生命周期。新产品通过硬件升级、数据管理革新及软件工具优化,助力企业提升效率并降低AI部署门槛。
在戴尔科技世界2025大会期间,戴尔科技与英伟达联合发布了最新版本的戴尔人工智能工厂。此次发布涵盖了由英伟达Blackwell Ultra GPU驱动的新款PowerEdge服务器、强化的人工智能数据管理工具以及全新的托管服务。这一系列产品旨在支持从模型训练到实际部署的整个AI生命周期,通过高性能计算、存储与网络的整合,为企业提供一个完整的企业级解决方案。
**硬件升级推动AI能力边界**
戴尔推出了支持每机架容纳多达256个NVIDIA Blackwell Ultra GPU的新款PowerEdge服务器。此次亮相的PowerEdge XE9785L和XE9712服务器专为运行由英伟达全新Blackwell GPU驱动的加速AI训练及推理任务而优化设计。这些系统的问世,为企业在AI应用中的性能表现、数据访问速度以及基础设施效率方面提供了显著提升。例如,采用8路NVIDIA HGX B300配置的系统可将大型语言模型训练速度提升四倍;而搭载NVIDIA GB300 NVL72的XE9712则实现了推理性能的最大化,其输出量较以往提升了50倍,吞吐量增加五倍。此外,这些服务器配备了直接到芯片的液冷技术和Dell PowerCool技术,以确保大规模热管理的高效性。
**数据管理工具革新助力效率飞跃**
戴尔升级了其ObjectScale数据平台,新增通过RDMA的S3支持,使得吞吐量提高了约两倍半,延迟降低了80%,并且CPU使用率减少了接近98%。这样的性能飞跃为更高GPU利用率铺平了道路,从而让模型能够更顺畅地获取所需的数据资源。与此同时,戴尔与英伟达AI数据平台以及NIXL库的合作进一步增强了大规模分布式推理的能力。此套工具组合不仅保证了数据的高速、稳定访问,还有效减少了数据中心扩张的需求,同时提高了数据层的速度与智能化水平。
**软件与语义工具聚焦自主AI**
通过新版戴尔AI工厂,用户得以访问英伟达AI Enterprise软件的各种功能,包括NeMo微服务、NIM推理框架、Llama Nemotron推理模型等。该平台还兼容Red Hat OpenShift,使得IT团队可根据具体需求灵活部署AI容器。这些内置工具简化了复杂推理、检索与响应的自主AI应用程序部署流程,大幅减少了传统模式下所需的集成工作量。此外,语义工具的应用进一步促进了自主AI的发展,为企业的智能化转型提供了有力支撑。
**托管服务弥合企业能力差距**
为了完善整体解决方案,戴尔推出了托管服务层,旨在帮助企业构建并维护完整的NVIDIA AI生态体系。从补丁管理到版本控制,再到7×24小时系统监控与基础设施维护,这套服务体系覆盖了AI密集型操作中的各个方面。这项举措有效地缓解了企业在人才短缺、系统复杂性、陡峭的AI生命周期管理曲线以及系统故障风险等方面的诸多难题,特别适合那些自身AI团队较为薄弱的组织。
**展望未来**
尽管基于Blackwell的戴尔基础设施迁移至现有企业数据中心需要精心规划,以规避可能出现的集成与热管理问题,但戴尔及其合作伙伴英伟达所打造的第二代AI工厂无疑为企业提供了前所未有的机遇。通过整合最尖端的GPU系统与服务器、存储及网络优势,戴尔AI工厂2.0有望填补当前企业规模AI基础设施存在的空白。对于缺乏专门AI基础设施或团队的企业而言,这种垂直整合可能成为决定成败的关键因素之一。
总体来看,此次发布的戴尔AI工厂不仅展现了硬件层面的突破,更体现了软件与服务领域的深度创新。随着这些效率改进措施的逐步落地,预计未来12个月内围绕实际投资回报率(ROI)与总拥有成本(TCO)的讨论将会增多。与此同时,本地AI基础设施的性价比也将接受来自公共云替代方案的竞争考验。如果成功实施,此类部署或将激励其他竞争对手加深与英伟达软硬件的集成,以保持自身的市场竞争力。
*注:如需了解更多详情,请访问戴尔科技官方网站上的下一代AI工厂创新页面。*
**分析与观点**
研究总监奥利维尔·布兰查德认为,戴尔与英伟达联手推出的AI工厂平台最新版本标志着向更加全面集成的企业级AI生态系统迈进了一大步。通过融合英伟达最先进的GPU系统与戴尔多年积累的服务器、存储及网络优势,第二代AI工厂致力于解决因AI集成和部署复杂性引发的一系列常见问题。其核心目标在于减少摩擦、降低采用门槛,并为企业提供一套预装好的生态系统,以便于随时部署和扩展。特别是在缺乏特定AI基础设施或专业团队的情况下,这种垂直整合可能是区分高昂前期投入与快速部署、扩展能力之间的重要指标。
此外,戴尔的托管服务业务亦是一大亮点,它为企业提供7×24小时的支持,帮助企业克服人才不足、系统复杂度高等挑战。这不仅提高了企业的运营效率,也降低了潜在的风险。因此,无论是从技术角度还是商业角度来看,此次发布的戴尔AI工厂2.0都具有里程碑式的意义。
**作者简介**
奥利维尔·布兰查德是一位资深的研究总监,专注于边缘半导体及智能AI设备领域。他不仅是Futurum研究咨询公司的核心成员,还曾参与撰写多本关于数字化转型和人工智能的著作。凭借丰富的行业经验和专业知识,布兰查德致力于帮助企业理解新技术,并指导他们如何最大化技术变革带来的正面效应,同时尽量减少其可能产生的负面影响。您可以通过X平台或LinkedIn关注他的更多动态。
(以上内容均由Ai生成)