DeepMind 全新自我进化 AI 编码代理的 5 项令人印象深刻的壮举

发布时间:2025年5月15日    来源:szf
DeepMind 全新自我进化 AI 编码代理的 5 项令人印象深刻的壮举

快速阅读: 《下一个 Web》消息,深度思维展示AI编程代理阿尔法进化,能优化大型语言模型解决复杂问题。其成就包括解决古老数学难题、提升谷歌数据中心效率、加速Gemini训练及设计AI芯片等。相关话题将在阿姆斯特丹TNW大会讨论。

深度思维(DeepMind)的AI系统近年来取得了显著的科学进展——从预测几乎所有已知蛋白质的三维结构,到更精确地预测天气。这家位于英国的实验室今天展示了其最新成果:阿尔法进化(AlphaEvolve),这是一种能够提升大型语言模型(LLMs)如Gemini在解决复杂计算和数学问题上的AI编程代理。阿尔法进化由其要改进的同一模型驱动。

使用Gemini,代理生成以代码形式表示的程序,尝试解决给定的问题。它通过自动测试运行每个代码片段,评估其准确性、效率或新颖性。阿尔法进化保留性能最优的代码片段,并将其作为下一轮生成的基础。经过多次循环,这一过程“进化”出越来越好的解决方案。本质上,这是一种能够自我进化的AI。

深度思维已经利用阿尔法进化优化了数据中心的能源使用,设计了更好的芯片,并加速了AI训练。以下是其迄今为止的五大成就:

1. **发现世界上最难数学问题的新解法**
本周价格上调!请在5月15日星期四之前注册TNW会议。节省大量费用,并于6月19日至20日加入数千名创始人、投资者和创新倡导者。立即注册。阿尔法进化在数学领域的50多个开放问题上进行了测试,从组合学到数论。在20%的情况下,它改进了这些问题的最佳已知解法。其中一个问题是存在300年之久的“接吻数问题”。在11维空间中,阿尔法进化发现了一种新的配置方式,使用593个球体得到了一个新的下界——这一进展甚至超越了顶尖的数学家。

2. **使谷歌的数据中心更加高效**
AI代理设计了一种更优的谷歌数据中心电力调度管理方案。这使得这家科技巨头在过去一年里提升了其数据中心能源效率0.7%——考虑到其数据中心的规模,这是一个重要的成本和能源节约。

3. **帮助加快了Gemini的训练速度**
阿尔法进化优化了矩阵乘法分解为子问题的方法,这是训练像Gemini这样的AI模型的核心操作。这一优化使流程提速23%,减少了Gemini总训练时间的1%。在生成式AI领域,每一个百分点都可以转化为成本和能源节约。

4. **共同设计了谷歌下一代AI芯片的一部分**
该代理还利用其编码技能重构了部分算术电路——一种用于芯片设计的语言,使其更加高效。同样的逻辑现正用于开发谷歌未来的张量处理单元(TPU),这是机器学习的先进芯片。

5. **击败了1969年的传奇算法**
几十年来,斯特拉森算法一直是4×4复杂数字矩阵相乘的黄金标准。阿尔法进化找到了一种更高效的解法——使用更少的标量乘法。这可能推动更先进的LLMs的发展,这些LLMs严重依赖矩阵乘法来运行。

根据深度思维的说法,这些成就是阿尔法进化冰山一角。该实验室设想这个代理可以解决无数问题,从发现新材料和药物到简化业务运营。AI的演进将是6月19日至20日在阿姆斯特丹举办的TNW大会热议的话题。活动门票正在热售中——在结账时使用代码TNWXMEDIA2025可享受30%的折扣。

故事由西恩·格施温特撰写
西恩是一名自由科学和技术记者,专注于气候和能源。从核聚变突破到电动汽车,他最开心的是挖掘独家新闻,调查新兴技术的影响,甚至亲自测试它们。他有五年的新闻经验,并持有南非开普敦大学的媒体和环境科学双学位。当他不写作时,你可能会发现他在远足、冲浪、打鼓或满足他的适度咖啡因瘾。你可以通过sion.geschwindt [at] protonmail [dot] com联系他。

订阅TNW简报
每周获取最重要的科技新闻。

(以上内容均由Ai生成)

你可能还想读

美国能源部 17 个国家实验室全景及创世纪计划战略布局分析

美国能源部 17 个国家实验室全景及创世纪计划战略布局分析

快速阅读: 美国能源部17个国家实验室构成顶尖科研体系,在基础科学、能源安全、气候变化等领域发挥关键作用。拥有全球领先的超算资源及顶尖人才,年经费约220亿美元。随着“创世纪计划”启动,实验室将形成协同网络,推动美国在清洁能源、量子计算等前 […]

发布时间:2025年12月8日
星舰月球计划更新,SpaceX誓不放弃月球竞争

星舰月球计划更新,SpaceX誓不放弃月球竞争

快速阅读: FSD V14.2.1在标志识别方面改进明显,长期测试者Chuck Cook观察到学校区域行为改善,系统对时间规则认识提高,有助于减少动态环境中的误报。 FSD V14.2.1在标志识别方面也显示出改进。长期测试者Chuck C […]

发布时间:2025年11月30日
太空竞赛再起波澜,SpaceX澄清与NASA合作细节

太空竞赛再起波澜,SpaceX澄清与NASA合作细节

快速阅读: Riot Games计划举办《英雄联盟》人机对抗赛,Grok 5参赛将受限于人类水平,展现AI实时互动能力,有望成最具影响力赛事。 尽管尚未确定具体比赛,但从选手、队伍以及Riot Games的兴趣来看,这一概念有可能实现,成为 […]

发布时间:2025年11月26日
中国广电称合作建设卫星移动互联网,展示业界首款一体化便携基站

中国广电称合作建设卫星移动互联网,展示业界首款一体化便携基站

快速阅读: 中国广电董事长宋起柱出席5G+工业互联网大会,提出强算注智、数智赋能、深耕特色三大举措,展示5G 700MHz应急基站,推动超高清产业与工业互联网发展。 IT之家 11 月 23 日消息,据人民邮电报报道,中国广电党委书记、董事 […]

发布时间:2025年11月23日
谷歌Gemini 3 Pro发布

谷歌Gemini 3 Pro发布

快速阅读: 谷歌发布新一代推理模型Gemini 3 Pro,显著提升数学、编程和视觉理解能力。一经发布,Gemini 3 Pro几乎横扫各大评测榜单,在LMArena大模型竞技场中以1501的Elo得分高居榜首。在MathArena数学竞赛 […]

发布时间:2025年11月19日
独具创新,直击痛点:深度解析华为十大最新方案

独具创新,直击痛点:深度解析华为十大最新方案

快速阅读: 第三个方案,是华为的U6GHzAAU天线。综合来看,华为的U6GAAU,真正实现了容量覆盖双优,助力全球U6G商用。LampSiteX,是LampSite系列的最新型号。第五个方案,是华为有源天线产品——EasyAAU。Easy […]

发布时间:2025年11月13日
Palantir估值承压仍领跑AI赛道

Palantir估值承压仍领跑AI赛道

快速阅读: 近期,美国AI概念股整体承压,Palantir与英伟达遭遇做空传闻,引发市场短暂震荡。然而,在宏观调整与估值质疑中,Palantir仍凭借强劲业绩与差异化AI布局维持长期增长势头。分析人士认为,该公司正处于由“政府数据支撑”向“ […]

发布时间:2025年11月12日
今日科创上海,“天问”绵延不辍

今日科创上海,“天问”绵延不辍

快速阅读: 11月11日,上海交大李政道研究所举办“天问·时代答卷”报告会,展示上海科技工作者在深地、深空、深海及AI领域的创新成果,推动国际科技创新中心建设。 “遂古之初,谁传道之?上下未形,何由考之?”两千多年前,屈原一篇《天问》洋洋洒 […]

发布时间:2025年11月11日