联通实现1500公里跨域大模型训练 算力损失不足5%
快速阅读: 据相关媒体最新报道,中国联通联合多家企业,成功实现超1500公里跨域异构大模型训练,等效算力达单芯片95%以上,推动算力互联与协同技术发展。
据中国联通合作伙伴大会消息,7月19日,在2025年大会期间,中国联通研究院联合上海人工智能实验室等多家合作伙伴,正式发布了全球最长距离大模型异构混训试验成果。
随着人工智能技术的快速发展,大模型训练对算力基础设施的要求越来越高,需要更高的吞吐量、更低的延迟和更强的性能。然而,当前算力资源分布不均,面临跨域资源互联互通机制不健全、长距离传输存在带宽与时延瓶颈、异构资源统一调度与高效融合能力有限等问题。
为此,中国联通携手上海人工智能实验室、阿里云、浪潮、基流科技、加佳科技等企业,针对国产异构GPU环境,满足超大模型跨域训练和碎片化算力整合的需求,利用“算力智联网AINet”长距无损传输技术和“DeepLink”超大规模跨域混训技术方案,在上海临港和山东济南鲍山数据中心之间,构建了一条超过1500公里的跨域异构混训系统。
试验结果显示,通过自动调整多种并行策略和跨域收敛比,联合团队成功完成了超1500公里跨域的千亿参数AI大模型异构混训试验,经验证等效算力达到单芯片单集群等效算力的95%以上。
在算力互联方面,采用了联通自主研发的内置长距RDMA协议栈的RoCE交换机,满足数据中心内部和之间的高性能网络需求;在算力调度与资源管理方面,通过“智驭”平台实现了对跨域网络和集群的统一管控及任务调度;在算力协同方面,基于DeepLink的技术支持,实现了千亿参数大模型在超长距离异构GPU环境下的高效训练。
中国联通表示,这一成果标志着公司在算力基础设施跨域协同调度、异构资源融合与高性能分布式训练等关键领域取得了实质性的技术突破,为下一代互联网产业的发展奠定了坚实基础。
(以上内容均由AI生成)