Arm携手OpenCloudOS发布Infra智能基座
快速阅读: 记者注意到,OpenCloudOS发布Infra智能基座,以破解AI部署碎片化难题,统一纳管异构硬件并聚合主流框架,将部署时间从天级压缩至分钟级;Arm协同优化算力效率,实测混元大模型预填充速度提升100%,社区已汇聚18万开发者,服务6.2万家企业。
2025年以来,人工智能加速融入成熟产业,推动算力需求呈现爆发式增长。然而,要使AI真正成为堪比互联网的时代级驱动力,亟需突破科技公司当前的“线性”发展模式,构建更加开源开放的生态体系。
当前,大模型部署已进入规模化深水区,但硬件与框架“碎片化”问题日益突出。开发者常需耗费60%以上的精力处理底层适配,部署流程繁琐。在此背景下,2025年OpenCloudOS操作系统生态大会正式发布Infra智能基座,旨在破解这一“适配之痛”。
该基座南向统一纳管多类异构硬件,深度集成主流AI芯片驱动,支持一键部署;北向则聚合PyTorch、vLLM等数十款全球主流框架,并将其封装为容器镜像,将部署时间从“天级”压缩至“分钟级”。同时,其与腾讯云HAI平台联动,提供开箱即用的AI-ready云服务器。
Arm云AI事业部工程高级总监Robert Williamson指出,面向大模型的开源操作系统必须演进为软硬件高效协同的AI分布式计算基座,具备加速器优先的内核架构、安全隔离的GPU资源管理以及优化的数据流协议栈。目前,Arm正通过SMMUv3等技术,与OpenCloudOS协同打破硬件壁垒,提升算力流动效率。
在生态协同方面,Arm已签署贡献者协议,投入工程资源参与社区开发,并将KleidiAI优化库集成至腾讯Angel等框架。实测显示,混元大模型的预填充速度提升100%,解码速度提升10%。
作为国内三大服务器操作系统根社区之一,OpenCloudOS截至2025年已汇聚18万名开发者、1200余家生态伙伴,装机量超2000万节点,服务6.2万家企业,覆盖政务、AI、交通等关键领域。
面对AI基础设施高能耗的挑战,开源操作系统通过软件优化实现降本增效。例如,容器镜像体积缩减94%,自研FlexKV系统在高并发场景下将首Token延迟降低70%。在安全方面,Arm CCA机密计算架构与OpenCloudOS协同构建可信执行环境,有效保障数据的机密性与完整性。
OpenCloudOS社区TOC主席王佳强调,唯有凝聚开发者、企业与生态伙伴的合力,才能筑牢AI时代的基础软件底座,推动产业从粗放的算力堆砌迈向精细化协同。
(以上内容均由Ai生成)
引用自:InfoQ网站