中国移动“九天”3.0发布,性能大幅提升并开源多项技术
快速阅读: 据相关媒体报道,7月26日,中国移动在AI大会上发布“九天”大模型3.0,具备高安全、可控、全国产等特点。其语言模型在多项国际评测中名列前茅,同时开源多个模型及数据集,助力行业发展。
7月26日,上海,中国移动在2025世界人工智能大会“AI 焕新 产业共赢”企业人工智能产业发展论坛上,正式发布了自主研发的“九天”基础大模型3.0。这标志着中国移动在大模型领域取得了重大进展,展现了其深厚的自研实力和持续的创新能力。
“九天”基础大模型3.0是国务院国资委战新“百大工程”的重要成果,具备“高安全、高可控、全国产、全行业”四大特性,并在多个方面实现了关键提升。其中,“九天众擎语言大模型”采用了可扩展至万亿级的MoE架构,通过15T token的多阶段配比预训练数据与全流程治理体系,显著增强了推理能力。该模型在GPQA-Diamond评测中以77.67分获得全球第二,在ArenaHard V1.0中以67.2分位居全球第一,在BFCL V3评测中达到68分。
此外,中国移动还推出了多个专项模型。九天代码大模型支持多种编程语言的代码生成、注释生成、单元测试生成和代码智能问答任务,在EvalPlus、MHPP、LivecodeBenchv6等多个代码生成榜单上表现出色。九天数学大模型在短思考和长思考模式下均达到业界领先水平,多项指标超过同类模型。
“九天善智多模态大模型”则通过引入复杂时空建模、流匹配图片视频渐进式联合训练等技术,显著提升了模型的生成可控性和理解能力。该模型不仅能生成高质量的图像和视频,还能进行多轮对话式高可控精确编辑操作,大幅提高了视觉生成的灵活性。在图理解和视频理解任务中,九天模型也表现出色,分别在MMStar、HallusionBench、OCRBench、Videomme和MVbench等评测中取得高分。
为了推动行业共同发展,中国移动还采取了开放策略,将多项模型及核心技术进行开源。开源内容包括九天数童结构化数据大模型、九天数学大模型、九天代码大模型以及结构化数据模型评测数据集和CCR-Bench行业场景复杂指令遵循评测数据集。这些资源已上线焕新社区、GitHub、HuggingFace、魔搭社区、Gitee和Arxiv,为开发者和研究人员提供了宝贵的支持。
(以上内容均由AI生成)