大型机在 AI 时代发挥作用吗?
快速阅读: 据《福布斯》最新报道,IBM推出的Z17主机搭载5nm泰勒姆二代CPU,性能大幅提升,功耗降低27%。它适用于金融交易、欺诈检测等AI场景,提供高效可靠的计算支持。IBM正整合多种AI资源,巩固其主机市场地位,下一代AI赋能主机已在研发中。
由人工智能生成,AI赋能的主机
弗朗西斯·希德科
在生成式人工智能首次进入主流意识的几年后,每个行业都在尝试利用它来提高效率并提供新的产品和服务。虽然训练将继续发展并推动创新,但推理将通过高级AI能力(如思维链推理、多模态功能和多模型支持)创造价值。这些推理解决方案的大部分讨论都集中在AI数据中心、边缘基础设施和设备端处理上。这就引出了一个问题:主机在AI时代中扮演什么角色?
**什么是主机?**
虽然服务器更多是为支持通用应用程序和多个客户端或功能(如网站托管和电子邮件服务器)而设计的,但主机则专为高容量、关键任务(如金融交易处理)而设计,并常用于受严格监管的行业。因此,主机需要更高的容量、可靠性和安全性,这得益于先进的虚拟化、灾难恢复、向后兼容性和内置冗余。此外,工作负载通常由集中式的主机系统处理,而在服务器架构中则常用分布式架构将工作负载分散到多个系统中。
凭借主机提供的容量、可靠性和安全性,以及其在支持高容量、高价值交易和数据处理方面的普遍性,主机在AI时代中的作用无疑是肯定的。IBM作为主机解决方案的领导者,全球70%的金融交易通过其主机进行,就是一个很好的例子。
**AI时代的主机**
**泰勒姆二代的技术参数**
弗朗西斯·希德科
IBM最近宣布了其Z系列主机的最新一代——Z17,旨在满足AI时代的需求,同时继续满足主机相关的严格期望。根据IBM公布的性能数据,这一代Z17由其5nm 5.5GHz泰勒姆二代CPU驱动,与前一代相比,单线程性能提升了11%,容量扩展高达20%,内存可达64TB,同时功耗减少了高达27%。此外,泰勒姆二代还配备了增强的板载AI加速器,能够处理预测性和某些生成式AI工作负载。对于需要更多加速的生成式AI工作负载,Z17还可以升级为新的Spyre加速器PCIe卡。
**更多内容**
弗朗西斯·希德科
根据IBM公布的性能数据,Z17比Z16一代提供了7.5倍的AI吞吐量,每天可进行多达4500亿次AI推理,响应时间为1毫秒。
**哪些AI工作负载需要主机?**
由于在金融交易和关键数据处理中的广泛应用,主机在结合使用预测性和生成式AI模型时最为有效。例如,由于其高容量、中央处理和多模型能力,主机可以有效地分析通过系统的交易和数据模式,并推断出可用于改进准确性和减少误报的结论,用于高级欺诈检测和反洗钱应用。主机还结合关键业务数据,帮助启用业务、代码和操作助手以提高生产力并减少技能培训所需的时间,以及自主代理型AI应用,如自动化交易和医疗保健应用。其他正在使用AI赋能主机的领域还包括但不限于贷款风险缓解、保险索赔欺诈检测和预防、支付欺诈、地理空间分析、气候变化影响、贷款风险缓解、网络安全和情感分析。
这些只是预测、生成式乃至代理型AI借助主机实现商业成果的众多应用场景之一,这些成果在标准服务器配置中由于数据和/或安全要求而可能效率低下或不可用,尤其是在通常使用主机的受严格监管行业中。
**主机在AI时代的未来**
根据IBM的说法,Z主机平台上已经有超过250个客户识别的AI用例,并且还在增长。但这不仅仅是关于硬件。IBM在其解决方案(包括Z平台)中整合了其他AI资源,如WatsonX、Granite、InstructLab,甚至咨询服务,将其定位为企业AI时代的强劲合作伙伴。竞争对手如戴尔、富士通和Unisys也在寻求利用AI为主机工作负载服务。下一代主机的研发周期通常为5到7年,如果它们像IBM那样,那么可以说下一代AI赋能主机已经在开发中。不仅主机在AI时代中得以存续,它们正在蓬勃发展。
(以上内容均由Ai生成)