MiniMax发布M2:2300亿参数专为智能Agent优化

发布时间:2025年10月28日    来源:szf
MiniMax发布M2:2300亿参数专为智能Agent优化

快速阅读: MiniMax发布新一代开源模型M2,采用MoE架构,总参数2300亿,每次推理激活100亿参数,实现每秒100个token输出,专为智能Agent设计,提升推理连贯性和响应效率,降低开发门槛。

在大模型竞赛从“拼参数”转向“拼效率”的关键时刻,MiniMax于10月27日发布了新一代开源推理模型M2。该模型通过精确的工程取舍,锁定智能Agent这一未来AI应用的核心领域。M2采用了混合专家架构(Mixture-of-Experts, MoE),总参数量达到2300亿,但在每次推理时仅激活100亿参数,实现了每秒100个token的输出速度,这一性能使其在实时交互场景中具有显著优势。尤为重要的是,M2专为智能Agent设计,增强了行为决策、多轮任务规划与环境交互中的推理连贯性和响应效率,为构建真正的自主AI智能体提供了底层引擎。

值得注意的是,与前代M1模型相比,M2在上下文窗口上进行了战略性调整,从M1支持的100万token大幅缩减至20.48万token。这并不是技术上的倒退,而是MiniMax在长文本处理、推理速度与部署成本之间做出的务实选择。虽然M1以“百万上下文”创造了记录,但其高资源消耗限制了实际应用;M2则专注于高频、高响应的Agent任务,在保持足够上下文长度的同时,显著提升了吞吐效率和经济性。

作为开源模型,M2进一步降低了开发者构建定制化智能体的门槛。无论是开发具备复杂任务链的虚拟助手、自动化工作流机器人,还是集成到企业系统中的决策Agent,开发者都可以基于M2快速迭代,灵活优化。

MiniMax明确将M2定位为“Agent时代的推理基石”。随着AI从“问答工具”向“行动代理”转变,M2的推出不仅是模型的升级,也是对未来AI应用模式的一次重要布局——当智能体需要快速思考、持续行动、高效交互时,速度和成本可能比上下文长度更加重要。

(以上内容均由Ai生成)

你可能还想读

AI试衣工具升级:自拍即可生成全身虚拟形象

AI试衣工具升级:自拍即可生成全身虚拟形象

快速阅读: 12月15日消息,谷歌升级AI虚拟试衣工具,依托Gemini 2.5 Flash图像套件中的Nano Banana模型,用户仅需上传单张自拍照即可生成全身数字形象,用于在搜索和购物平台试穿服饰,显著降低使用门槛并提升个性化体验。 […]

发布时间:2025年12月15日
大模型加速勒索软件攻击但未引发根本变革

大模型加速勒索软件攻击但未引发根本变革

快速阅读: 据SentinelLABS报告,大型语言模型正加速勒索软件攻击各环节效率,降低犯罪门槛并推动团伙碎片化,但未催生全新战术;攻击者倾向使用自托管开源模型规避审查,防御方需应对工业化升级的勒索威胁。 近期,网络安全研究机构Senti […]

发布时间:2025年12月15日
英伟达推Nemotron 3进军大模型领域

英伟达推Nemotron 3进军大模型领域

快速阅读: 据OpenRouter报告,2025年其平台约三分之一数据来自中国开源AI模型,深度求索、阿里等企业持续公开技术细节以吸引开发者;此举正推动国产芯片与模型协同,或削弱英伟达在中国市场的长期优势。 近日,人工智能平台OpenRou […]

发布时间:2025年12月15日
Seceon携手InterSources拓展AI网络安全服务

Seceon携手InterSources拓展AI网络安全服务

快速阅读: 据Seceon公司透露,该公司与技术服务商InterSources达成战略合作,将把其基于动态威胁建模的开放式威胁管理平台纳入后者安全服务组合,重点拓展医疗、金融等高合规要求行业,相关服务已进入部署准备阶段。 2025年12月1 […]

发布时间:2025年12月15日
英伟达推新模型抢占开源AI先机

英伟达推新模型抢占开源AI先机

快速阅读: 据彭博社报道,英伟达发布Nemotron 3开源大模型系列,包含Nano、Super和Ultra三个版本,参数最高达5000亿,旨在降低企业AI部署成本并提升精度;其中Nano版已上线Hugging Face,上下文窗口扩展至1 […]

发布时间:2025年12月15日
深度学习模型逐细胞预测果蝇发育过程

深度学习模型逐细胞预测果蝇发育过程

快速阅读: 据多家机构披露,麻省理工学院团队开发出新型深度学习模型,可高精度预测果蝇胚胎发育中单个细胞的动态行为,准确率达90%,有望助力器官发育研究及哮喘等疾病的早期诊断。 近日,麻省理工学院(MIT)工程师团队开发出一种新型深度学习模型 […]

发布时间:2025年12月15日
微软高管:AI智能体将重塑企业工作模式

微软高管:AI智能体将重塑企业工作模式

快速阅读: 截至今日,2026年5月19日至20日财富职场创新峰会将在亚特兰大举行,聚焦人工智能与人文战略融合重塑工作模式,全球创新领袖将探讨技术赋能、组织韧性等议题,助力企业应对职场变革挑战。 2026年5月19日至20日,财富职场创新峰 […]

发布时间:2025年12月15日
DuploCloud推AI运维工程师可执行真实基础设施任务

DuploCloud推AI运维工程师可执行真实基础设施任务

快速阅读: 据DuploCloud消息,该公司近日推出“AI DevOps工程师”服务,通过具备执行能力的智能体自动完成基础设施部署、排障与优化,在安全边界内协同人类团队提升运维效率,已支持AWS、Azure和谷歌云平台,新功能即日起向所有 […]

发布时间:2025年12月15日