中国移动“九天”3.0发布，性能大幅提升并开源多项技术

发布时间：2025年7月29日来源：szf

快速阅读: 据相关媒体报道，7月26日，中国移动在AI大会上发布“九天”大模型3.0，具备高安全、可控、全国产等特点。其语言模型在多项国际评测中名列前茅，同时开源多个模型及数据集，助力行业发展。

7月26日，上海，中国移动在2025世界人工智能大会“AI 焕新产业共赢”企业人工智能产业发展论坛上，正式发布了自主研发的“九天”基础大模型3.0。这标志着中国移动在大模型领域取得了重大进展，展现了其深厚的自研实力和持续的创新能力。

“九天”基础大模型3.0是国务院国资委战新“百大工程”的重要成果，具备“高安全、高可控、全国产、全行业”四大特性，并在多个方面实现了关键提升。其中，“九天众擎语言大模型”采用了可扩展至万亿级的MoE架构，通过15T token的多阶段配比预训练数据与全流程治理体系，显著增强了推理能力。该模型在GPQA-Diamond评测中以77.67分获得全球第二，在ArenaHard V1.0中以67.2分位居全球第一，在BFCL V3评测中达到68分。

此外，中国移动还推出了多个专项模型。九天代码大模型支持多种编程语言的代码生成、注释生成、单元测试生成和代码智能问答任务，在EvalPlus、MHPP、LivecodeBenchv6等多个代码生成榜单上表现出色。九天数学大模型在短思考和长思考模式下均达到业界领先水平，多项指标超过同类模型。

“九天善智多模态大模型”则通过引入复杂时空建模、流匹配图片视频渐进式联合训练等技术，显著提升了模型的生成可控性和理解能力。该模型不仅能生成高质量的图像和视频，还能进行多轮对话式高可控精确编辑操作，大幅提高了视觉生成的灵活性。在图理解和视频理解任务中，九天模型也表现出色，分别在MMStar、HallusionBench、OCRBench、Videomme和MVbench等评测中取得高分。

为了推动行业共同发展，中国移动还采取了开放策略，将多项模型及核心技术进行开源。开源内容包括九天数童结构化数据大模型、九天数学大模型、九天代码大模型以及结构化数据模型评测数据集和CCR-Bench行业场景复杂指令遵循评测数据集。这些资源已上线焕新社区、GitHub、HuggingFace、魔搭社区、Gitee和Arxiv，为开发者和研究人员提供了宝贵的支持。

(以上内容均由AI生成)