劳德研究所启动“弹弓”AI资助计划15个团队入选,重新定义AI评估标准

发布时间:2025年11月7日    来源:szf
劳德研究所启动“弹弓”AI资助计划15个团队入选,重新定义AI评估标准

快速阅读: 劳德研究所启动“弹弓”人工智能资助计划,首批15个项目聚焦AI评估体系,涵盖代码优化、商业决策等领域,旨在加速AI研究与应用创新。

周四,劳德研究所(Loud Institute)宣布启动首批“弹弓(Slingshot)”人工智能资助计划,旨在“推进人工智能的科学与实践”。该计划通过为研究人员提供传统学术机构难以匹配的资源——包括资金、计算能力以及产品和工程支持——以加速AI研究与落地创新。作为回报,受助者需产出可实际转化的成果,如初创公司、开源项目或其他形式的研究成果。

首批共有 15个项目入选 ,重点聚焦当前人工智能领域最具挑战性的议题之一—— AI评估体系 。其中多个项目已经在业界拥有知名度,如命令行编码基准测试工具 Terminal Bench ,以及长期关注通用人工智能(AGI)能力测评的 ARC-AGI 项目 最新 版本。

与此同时,多支团队正尝试以全新视角解决评估瓶颈。加州理工学院与德克萨斯大学奥斯汀分校合作开发的 Formula Code 项目,旨在评估AI代理在优化现有代码时的表现;哥伦比亚大学团队推出的 BizBench ,则面向“白领AI代理”构建综合测试标准,聚焦AI在商业和决策类任务中的真实表现。此外,还有部分项目探索强化学习与模型压缩的新方法,以建立更具普适性和可扩展性的评估框架。

值得关注的是, SWE-Bench 联合创始人 John Boda Yang 也加入了本轮计划,他将领导新项目 CodeClash 。该项目受SWE-Bench成功经验启发,计划通过动态、竞赛式机制评估AI代码能力。

Yang在接受TechCrunch采访时表示:“我认为持续利用第三方核心基准进行开放评估,是推动整个行业进步的关键。但我也担心,未来的评测体系若被个别公司垄断,将可能削弱研究的开放性与可比性。” 通过“弹弓”计划,劳德研究所正试图在学术与产业之间搭建新的桥梁,使前沿AI研究成果能够更快地转化为实际应用。这一举措被视为当前AI领域评估体系重塑的重要一步。

(以上内容均由Ai生成)

你可能还想读

非洲CEO视AI为生存之道,积极投资人才发展

非洲CEO视AI为生存之道,积极投资人才发展

快速阅读: 非洲首席执行官视人工智能为增长引擎,79%对未来乐观,61%已投资AI,62%重视人才发展,积极应对数据质量挑战,推动技术进步。 非洲首席执行官视人工智能为生存战略 / KPMG 2025非洲首席执行官展望 非洲的首席执行官们在 […]

发布时间:2025年11月8日
瑞士Motley获150万美元融资,推出AI商业报告平台

瑞士Motley获150万美元融资,推出AI商业报告平台

快速阅读: 瑞士莫特利完成150万美元种子轮融资,推出AI驱动的商业报告平台,简化报告流程,提升团队效率,支持决策制定。 总部位于瑞士的莫特利(Motley)完成了150万美元的种子前轮融资,并推出了其商业报告平台。本轮由Seedcamp领 […]

发布时间:2025年11月8日
电网巨头竞相投资AI,提升电力系统韧性与效率

电网巨头竞相投资AI,提升电力系统韧性与效率

快速阅读: 杜克能源投资AI企业AiDash,利用卫星图像和机器学习监测电网植被,减少停电和野火风险,适应数据中心和电气化需求增长,推动电网智能化转型。 杜克能源转向人工智能并非为了追逐最新的技术趋势。该公司转向AI是因为每年的风暴季节都在 […]

发布时间:2025年11月8日
OpenAI CEO萨姆·阿尔特曼称AI未来可能比人类更可信担任CEO

OpenAI CEO萨姆·阿尔特曼称AI未来可能比人类更可信担任CEO

快速阅读: OpenAI CEO萨姆·阿尔特曼表示,希望OpenAI成为首个由AI担任CEO的公司,认为AI管理公司将在未来实现,但承认社会接受AI领导需时日。 近年来,人工智能(AI)引起了人们的广泛关注,其在几乎所有领域的优势令人兴奋。 […]

发布时间:2025年11月8日
声纹科技五年内能否巩固全球AI语音地位?

声纹科技五年内能否巩固全球AI语音地位?

快速阅读: SoundHound未来五年内将在全球语音AI领域建立市场地位,通过广泛合作构建经济护城河,尽管目前亏损增速快于收入增长,市场热情仍以投机为主。 在未来五年内,SoundHound有望在全球语音人工智能领域建立令人期待的市场地位 […]

发布时间:2025年11月8日
美国解禁AI芯片销售,中国反制令英伟达市场归零

美国解禁AI芯片销售,中国反制令英伟达市场归零

快速阅读: 白宫解除对中国AI芯片销售禁令,但北京以安全为由将英伟达排除市场,黄仁勋称英伟达中国份额归零,特朗普禁止向中国出售最强芯片。 7月,白宫解除了对中国部分AI芯片销售的禁令,似乎表明这一论点取得了成功。然而,北京方面却反戈一击,以 […]

发布时间:2025年11月8日
苹果拟每年斥资10亿美元引入谷歌Gemini升级Siri

苹果拟每年斥资10亿美元引入谷歌Gemini升级Siri

快速阅读: 苹果接近与谷歌达成10亿美元协议,使用Gemini模型升级Siri,提升摘要和任务规划能力。苹果计划在私有服务器上运行定制Gemini模型,保护用户数据。新Siri预计随iOS 26.4于明年春季发布。 据报道,苹果公司正接近达 […]

发布时间:2025年11月8日
奥卡AI推出船队共享实时数据系统,优化航行安全与效率

奥卡AI推出船队共享实时数据系统,优化航行安全与效率

快速阅读: Orca AI通过1000多艘装备其系统的船只,构建了实时共享警报的众包导航引擎,涵盖天气、交通和监管信息,提高航行安全与效率。 通过连接不断扩大的安装了Orca AI系统的1000艘船只网络(图示),并有更多船只即将加入,Co […]

发布时间:2025年11月8日