AI

层次推理模型HRM实现AI推理速度百倍提升

发布时间:2025年9月2日    来源:szf
层次推理模型HRM实现AI推理速度百倍提升

快速阅读: 新加坡初创公司Sapient Intelligence推出创新AI架构HRM,通过层次化设计在复杂推理任务中超越大型语言模型,数据需求和模型规模更低,推理速度提升100倍。

新加坡初创公司 Sapient Intelligence 最近推出了一种创新的人工智能架构,名为 “层次推理模型”(HRM)。该模型在复杂推理任务中能够与现有的大型语言模型(LLMs)相媲美,甚至在某些情况下表现更佳,且其数据需求和模型规模均远低于传统模型。HRM 的设计理念源自人类大脑,旨在通过不同的思维系统实现高效推理。

当前的 LLMs 在解决复杂问题时,通常依赖于链式思维(CoT)方法,通过生成一系列文本步骤来进行推理。虽然这一方法在一定程度上提升了模型的推理能力,但也存在明显的不足。研究人员指出,链式思维依赖于人为定义的步骤,一旦出现错误,可能导致整个推理过程的失败。因此,Sapient Intelligence 的研究团队提出了一种新方式,即 “潜在推理”。该方式使得模型能够在内部抽象的空间中进行推理,而不是仅仅依赖于文本生成。

HRM 由两个相互作用的模块构成:一个是高层模块,负责缓慢而抽象的规划;另一个是低层模块,进行快速而详细的计算。这种层次化的设计使 HRM 在进行深度推理时,无需依赖大量的输入数据。测试结果表明,HRM 在处理如抽象推理和复杂数独等高难度任务时,取得了优异的成绩,展现了其在复杂任务中的强大能力。

除了准确性,HRM 还在推理速度方面表现出色。根据 Sapient Intelligence 的创始人王冠的介绍,HRM 在执行特定复杂推理任务时,能够实现 “任务完成时间的100倍提速”。这意味着 HRM 能够在边缘设备上快速进行强大的推理计算,显著降低企业的时间和成本。

展望未来,Sapient Intelligence 正在努力将 HRM 发展为一种更通用的推理解决方案,计划将其应用于医疗、气候预测和机器人等多个领域。这一发展标志着,未来 AI 的成功之道,可能并不在于简单地扩大模型规模,而是借鉴人类大脑的结构,开发出更智能、更高效的推理架构。

划重点: 🚀 HRM 通过新型层次化架构,在复杂推理任务中超越大型语言模型,且需要更少的数据。

🔍 HRM 模型结合高层和低层模块,提升了推理速度和效率。

💼 未来 AI 可能更多地借鉴人类大脑的设计,而非单纯依赖于规模扩大。

(以上内容均由Ai生成)

你可能还想读

法律团队如何审慎应用自主AI获最大效益

法律团队如何审慎应用自主AI获最大效益

快速阅读: 据最新消息,智能体AI在法律领域引发关注,其高自主性可执行多步骤任务提升效率,但带来责任认定、合同效力等新型风险,专家建议依“自主性光谱”精准配置风控资源。 近日,人工智能技术在法律领域的应用迈入新阶段。继生成式AI之后,具备更 […]

发布时间:2025年12月8日
亚马逊推Alexa+迈入全代理AI时代

亚马逊推Alexa+迈入全代理AI时代

快速阅读: 据外媒报道,亚马逊推出新一代智能体AI系统Alexa+,中兴与字节跳动联合研发全球首款全智能体AI手机,该技术正加速渗透医疗健康领域,可自主执行复杂任务并提升服务效率。 近日,全球人工智能领域加速向“智能体”(agentic A […]

发布时间:2025年12月8日
网传普京持《薄伽梵歌》照片系AI生成

网传普京持《薄伽梵歌》照片系AI生成

快速阅读: 据媒体报道,近日网传普京在专机手持《薄伽梵歌》的照片系AI合成,经事实核查机构BOOM验证含谷歌SynthID水印,该虚假图像由屡传不实信息的账号首发,旨在制造地缘政治误导。 近日,一张据称显示俄罗斯总统普京在专机上手持《薄伽梵 […]

发布时间:2025年12月8日
AMD锐龙7 9850X3D泄露:单核加速达5.6GHz

AMD锐龙7 9850X3D泄露:单核加速达5.6GHz

快速阅读: 据最新消息,AMD Ryzen 7 9850X3D工程样品在多款主板上运行稳定,单核频率近5.6GHz,Zen 5架构优化显著,平台兼容性良好,有望近期发布。 近日,有关AMD即将推出的Ryzen 7 9850X3D处理器的最新 […]

发布时间:2025年12月8日
英特尔BMG-G31显卡即将发布

英特尔BMG-G31显卡即将发布

快速阅读: 据最新消息,英特尔将BMG-G31显卡纳入软件支持体系,该芯片配备32个Xe2核心与16GB显存,预计2026年初以Arc B770命名亮相,旨在强化中高端GPU市场竞争力。 英特尔公司近日正式将代号为“Big Battlema […]

发布时间:2025年12月8日
戴尔Pro笔记本:AI时代企业首选

戴尔Pro笔记本:AI时代企业首选

快速阅读: 据国际数据公司(IDC)报道,戴尔推出Dell Pro系列AI商用笔记本,搭载NPU与Windows 11 Copilot+,支持长效续航、军工级耐用性及本地AI安全防护,助力企业提升效率并降低长期更新成本。 随着2025年接近 […]

发布时间:2025年12月8日
英伟达4B小模型登顶ARC评测,成本仅GPT-5 Pro的136

英伟达4B小模型登顶ARC评测,成本仅GPT-5 Pro的136

快速阅读: 12月8日消息,英伟达推出4B参数小模型NVARC,在ARC-AGI2评测中以27.64%准确率超越GPT-5Pro,单任务推理成本仅0.2美元,凭借零预训练策略和合成数据实现高效低成本部署。 近日,英伟达研发的4B参数小模型N […]

发布时间:2025年12月8日
Meta收购Limitless加码AI可穿戴设备

Meta收购Limitless加码AI可穿戴设备

快速阅读: 据最新消息,Meta收购AI可穿戴设备公司Limitless,后者以无屏幕智能吊坠著称,具备语音交互与实时转录功能;收购后团队并入Meta,专注AI硬件研发,现有产品将停售但提供一年技术支持。 日前,美国科技企业Meta宣布收购 […]

发布时间:2025年12月8日