Google DeepMind 的思维模型:预期结果

发布时间:2025年3月10日    来源:szf
Google DeepMind 的思维模型:预期结果

快速阅读: 《印度分析杂志》消息,谷歌DeepMind研发了一种新型“思考模型”,在数学、编码和多模态推理等方面表现出色。该模型将在Gemini中使用,并考虑与谷歌搜索和地图集成。谷歌DeepMind计划收集开发者反馈,并在两年内将其推向通用可用性,以增强其自主性和解决问题的能力。

谷歌DeepMind公司在开发“思考模型”方面取得了显著进展——这是一种新型的人工智能模型,能够更有效地进行推理、规划和解决复杂问题。在YouTube频道“谷歌开发者”上的一期播客中,谷歌DeepMind的首席研究科学家杰克·雷详细介绍了谷歌DeepMind的思考模型是如何构建的,让我们得以一窥未来的发展。“推理模型的关键在于它会尝试将知识应用到一个可能新颖或未见过的具体情境中,”他告诉谷歌DeepMind的高级产品经理洛根·基拉帕蒂克。进展如何?谷歌的努力已经使他们的思考模型在数学、编码和多模态推理等任务上的性能有了显著提升。谷歌DeepMind最近进行的一项研究显示,人工智能通过“心智进化”技术能进行更深层次的思考。“我们看到的确实是一个新的范式,”雷说,“我们找到了多种方法来增加推断时间的计算量。”

该公司已经开始收获劳动成果。他们发布了两个实验性的Gemini Flash思考模型,这些模型可以在AI工作室免费使用。在谈及产品发布时,雷强调,未来思考模型将更多地使用Gemini中的工具。“模型在思考过程中将越来越多地使用各种工具,以真正触及需要解决的问题的核心本质,”雷预测。他还提供了模型与谷歌搜索和地图集成的例子。雷认为,由于这种整合,模型将变得更加自主,即使在思考时也是如此。雷还认为,业界无需任何研究突破即可实现模型拥有“无限上下文”的可能性。他强调,所需的成分已经具备,我们只需要工程学将其变为现实。

反馈在其发展循环中的作用

雷告诉基拉帕蒂克,他对模型在实验阶段推出感到兴奋,因为用户反馈将帮助他们更多地了解思考模型的能力。为了说明反馈如何塑造开发过程,雷回忆起一次经历:他没有意识到32k上下文支持仅限于人员使用,直到他联系了正在将推理模型作为研究一部分使用的学者。同样,他还分享了一个例子,在用户尝试从Gemini Flash切换到Flash Thinking模型时,内部代码需要更改,然后他负责修复这一问题。谈到思考模型发展的进度表,他说他们从2024年10月开始工作,并计划两年内准备好模型供开发者反馈。在12月底假期期间收到反馈后,他们在2025年1月更新了模型。虽然雷没有正式提及,但一些敏锐的互联网观察者推测,基于非实验性思考模型的新Gemini模型可能会在3月12日发布。

谷歌DeepMind的思考模型的未来

“我们期待着一系列非常令人兴奋的未来发布,”雷透露。公司正积极收集开发者的反馈,并致力于将模型推向通用可用性(GA)发布。“很明显,人们希望在这个模型上构建并将其作为稳定的基石,”雷承认。“而GA对于这一点至关重要。所以这绝对是我们的路线图之一。”谷歌DeepMind计划继续提高其能力,探索新的产品体验,并使其能够在思考过程中使用代码执行和搜索等工具。思考模型也有望在AI代理的发展中发挥关键作用,这些代理可以与世界互动并自主执行任务。“我认为推理将为有用的自主能力带来两件非常重要的因素。一是可靠性……另一点是复杂能力。”

随着谷歌DeepMind不断拓展人工智能的边界,思考模型很可能将成为未来人工智能系统的核心,使它们能够解决越来越复杂的问题,并以更有意义的方式与世界互动。

(以上内容均由Ai生成)

你可能还想读

LEO卫星信号助力弱GPS区域精准导航

LEO卫星信号助力弱GPS区域精准导航

快速阅读: 据最新消息,美国俄亥俄州立大学研究证实,星链与一网等低轨卫星信号可有效补充GPS,在无GNSS环境下将定位误差从超1公里降至约27米,为关键基础设施提供高精度导航备份方案。 日前,美国俄亥俄州立大学研究团队证实,商业低轨(LEO […]

发布时间:2025年12月8日
美国能源部 17 个国家实验室全景及创世纪计划战略布局分析

美国能源部 17 个国家实验室全景及创世纪计划战略布局分析

快速阅读: 美国能源部17个国家实验室构成顶尖科研体系,在基础科学、能源安全、气候变化等领域发挥关键作用。拥有全球领先的超算资源及顶尖人才,年经费约220亿美元。随着“创世纪计划”启动,实验室将形成协同网络,推动美国在清洁能源、量子计算等前 […]

发布时间:2025年12月8日
星舰月球计划更新,SpaceX誓不放弃月球竞争

星舰月球计划更新,SpaceX誓不放弃月球竞争

快速阅读: FSD V14.2.1在标志识别方面改进明显,长期测试者Chuck Cook观察到学校区域行为改善,系统对时间规则认识提高,有助于减少动态环境中的误报。 FSD V14.2.1在标志识别方面也显示出改进。长期测试者Chuck C […]

发布时间:2025年11月30日
太空竞赛再起波澜,SpaceX澄清与NASA合作细节

太空竞赛再起波澜,SpaceX澄清与NASA合作细节

快速阅读: Riot Games计划举办《英雄联盟》人机对抗赛,Grok 5参赛将受限于人类水平,展现AI实时互动能力,有望成最具影响力赛事。 尽管尚未确定具体比赛,但从选手、队伍以及Riot Games的兴趣来看,这一概念有可能实现,成为 […]

发布时间:2025年11月26日
中国广电称合作建设卫星移动互联网,展示业界首款一体化便携基站

中国广电称合作建设卫星移动互联网,展示业界首款一体化便携基站

快速阅读: 中国广电董事长宋起柱出席5G+工业互联网大会,提出强算注智、数智赋能、深耕特色三大举措,展示5G 700MHz应急基站,推动超高清产业与工业互联网发展。 IT之家 11 月 23 日消息,据人民邮电报报道,中国广电党委书记、董事 […]

发布时间:2025年11月23日
谷歌Gemini 3 Pro发布

谷歌Gemini 3 Pro发布

快速阅读: 谷歌发布新一代推理模型Gemini 3 Pro,显著提升数学、编程和视觉理解能力。一经发布,Gemini 3 Pro几乎横扫各大评测榜单,在LMArena大模型竞技场中以1501的Elo得分高居榜首。在MathArena数学竞赛 […]

发布时间:2025年11月19日
独具创新,直击痛点:深度解析华为十大最新方案

独具创新,直击痛点:深度解析华为十大最新方案

快速阅读: 第三个方案,是华为的U6GHzAAU天线。综合来看,华为的U6GAAU,真正实现了容量覆盖双优,助力全球U6G商用。LampSiteX,是LampSite系列的最新型号。第五个方案,是华为有源天线产品——EasyAAU。Easy […]

发布时间:2025年11月13日
Palantir估值承压仍领跑AI赛道

Palantir估值承压仍领跑AI赛道

快速阅读: 近期,美国AI概念股整体承压,Palantir与英伟达遭遇做空传闻,引发市场短暂震荡。然而,在宏观调整与估值质疑中,Palantir仍凭借强劲业绩与差异化AI布局维持长期增长势头。分析人士认为,该公司正处于由“政府数据支撑”向“ […]

发布时间:2025年11月12日