京东云JoyBuilder千卡训练提速3.5倍
快速阅读: 12月8日消息,京东云JoyBuilder平台完成关键升级,支持GR00T N1.5千卡训练,兼容LeRobot框架,训练效率提升3.5倍,亿级数据训练从15小时缩短至22分钟。
日前,京东云JoyBuilder模型开发平台完成关键升级,成功支撑业界顶尖具身智能模型GR00T N1.5实现千卡级训练。该平台由此成为行业首家支持LeRobot开源训练框架的AI开发平台,在训练效率上较开源社区版本提升3.5倍。通过软硬件深度调优与算法突破,原本需15小时完成的亿级数据千卡训练,现仅耗时22分钟,显著加速具身智能技术的规模化落地进程。
为达成这一突破,京东云AI Infra及相关团队对JoyBuilder实施全栈优化。在数据链路方面,平台重构预处理与加载流程,实现CPU与GPU异步执行,并依托自研高性能并行文件系统云海JPFS,在1024卡集群上提供超400GB/s读取带宽,保障高速数据供给。此外,针对主流视觉-语言-动作(VLA)模型的计算特性,团队在Attention层、Token裁剪及训练后量化等环节进行极致优化。
在基础设施层面,该平台部署3.2T RDMA后端网络,结合多轨道优化、拓扑感知调度与智能震荡抑制技术,确保千卡集群集合通信的高吞吐与低延迟,支持长周期稳定训练。同时,依托云原生AI数据湖,进一步优化数据调度与流水线效率。目前,JoyBuilder已全面兼容LeRobot最新训练协议,确立其在具身智能AI开发平台领域的领先地位。
(以上内容均由Ai生成)