中国移动发布“九天”3.0大模型 核心技术开源
快速阅读: 相关媒体消息,7月26日,中国移动发布“九天”大模型3.0,强化高安全、高可控、全国产、全行业特点,在语言、多模态及开源方面升级,性能全球领先。
据中国移动焕新发布,7月26日,在2025世界人工智能大会“AI焕新产业共赢”企业人工智能产业发展论坛上,中国移动发布了“九天”基础大模型3.0。这一版本作为国务院国资委战新“百大工程”的新成果,强化了“高安全、高可控、全国产、全行业”四大特点,并在三个方面进行了升级:
一是九天众擎语言大模型实现了架构与性能的双重提升。采用可扩展至万亿级的MoE架构,通过15T token多阶段配比预训练数据与全流程治理体系,增强了推理能力。创新构建113域×53能力的二维分级后训练框架,结合动态强化学习策略,使复杂推理能力提升了35%。在GPQA-Diamond评测中,“九天”以77.67分排名全球第二;在ArenaHard V0.1中,以67.2分位列全球第一;在BFCL V3评测中,得分达到68分。此外,模型还加强了可控生成能力,解决了沉浸式角色演绎、精确流程内置等技术难题,实现了专业场景下的零幻觉。
二是九天善智多模态大模型提升了生成可控性和理解能力。基于复杂时空建模、流匹配图片视频渐进式联合训练等技术,模型不仅能够生成高质量的图像和视频,还能进行多轮对话式的高可控精确编辑操作,显著提高了视觉生成的灵活性。在图理解和视频理解方面,九天模型的表现也达到了业界领先水平。
三是模型及核心技术开源。此次开源的内容包括九天数童结构化数据大模型、九天数学大模型、九天代码大模型,以及业界首创的结构化数据模型评测数据和CCR-Bench行业场景复杂指令遵循评测数据集。这些资源已在焕新社区、GitHub、HuggingFace、魔搭社区、Gitee、Arxiv等平台上发布。
中国移动九天人工智能研究院计划于8月推出此次发布内容的技术深度解读。
(以上内容均由AI生成)