谷歌在“赢家通吃”AI 模型竞赛中首次推出备受吹捧的 Gemini 2.5

发布时间:2025年3月27日    来源:szf
谷歌在“赢家通吃”AI 模型竞赛中首次推出备受吹捧的 Gemini 2.5

快速阅读: 据《PYMNTS.com》最新报道,谷歌推出最强AI模型Gemini 2.5,在多项基准测试中大幅领先 competitors,具备超强推理和多模态能力,上下文窗口达100万标记,未来将整合至全系列模型并扩展至200万标记,助力复杂任务处理。

谷歌推出了迄今为止最强大的生成式人工智能模型,该模型在行业基准测试中大多表现远超其最坚定的竞争对手,从而在激烈的AI竞赛中开辟了新的战场。作为谷歌家族的一员,Gemini 2.5是其“最智能”的模型,并且在推理能力上大幅领先顶级模型,包括来自OpenAI、Anthropic、Grok和DeepSeek等公司的模型,“领先幅度显著”,谷歌旗下DeepMind首席技术官科尔·卡夫丘古鲁在周三(3月26日)的博客文章中写道。这意味着采用生成式AI模型的企业可以在谷歌云工具箱中使用更强大的工具来构建定制应用程序。“谷歌的Gemini 2.5已经落地——这是一款推理、多模态和原始计算力量的杰作,”投资公司Njordis创始人安德斯·因德塞告诉PYMNTS。谷歌正在“投身于一场不再是短跑而是无情的、胜者通吃的围攻式的AI竞赛。”

在推理和知识方面,Gemini 2.5击败了OpenAI的o3-mini和GPT-4.5、Claude 3.7 Sonnet、Grok 3 Beta和DeepSeek R1。同样的情况也出现在代码编辑、视觉推理、长上下文和多语言性能方面。在科学领域,它击败了所有对手,除了Claude。在数学方面,它仅次于Grok。在代码生成方面,它的表现相对最弱,排名第三。

谷歌即将推出的Gemini 2.5的第一个版本是一个实验性Pro版本。它可供Gemini Advanced付费用户使用,并将很快登陆谷歌云的Vertex AI平台,根据博客文章所述。开发者和企业可以在谷歌AI工作室试用它。阅读更多:谷歌希望到年底拥有5亿Gemini AI用户。

**通过思考得出答案**

Gemini 2.5是一款思考或推理模型,它会在回应之前暂停并循环检查逻辑,以提高答案的准确性和性能。根据文章内容,它分析信息,得出逻辑结论,添加上下文并理解细微差别以作出决策。谷歌的竞争对手已经发布了自己的推理模型,其中包括来自OpenAI、Anthropic、Grok、DeepSeek等公司的模型。谷歌本身也发布了一个名为Gemini 2.0 Flash Thinking的推理模型。然而,根据文章,Gemini 2.5超越了Gemini 2.0 Flash Thinking的推理能力,后者使用了强化学习(奖励正确答案,惩罚错误答案)和思维链提示。文章指出,通过Gemini 2.5,谷歌结合了一个“显著增强的基础模型与改进的后训练”,达到了一个新的性能水平。未来,谷歌将把这些思考能力直接整合到所有模型中,以便它们能够处理“复杂问题并支持更强大、情境感知的代理”。

同样地:谷歌的Gemini 2.0承诺自主控制复杂业务任务75万字的提示。

**与谷歌其他Gemini模型一样,Gemini 2.5是原生多模态的,这意味着它可以分析和理解文本、音频、视频、图像和代码——这些能力是从底层构建的,而不是附加的。**

Gemini 2.5还提供了100万个标记的上下文窗口(约75万英文单词),因此它可以接受非常长的提示,这一功能仅在阿里巴巴的一些Qwen生成式AI模型中可以匹配。“上下文窗口对于AI竞赛来说至关重要,”Trevolution Group数据科学主管伊利亚·巴季耶夫告诉PYMNTS。“上下文长度是[AI模型]实际应用中最关键的参数之一。”巴季耶夫说:“有了更大的上下文,模型可以更好地协助编程、回答问题和文本生成——基本上任何事情都可以。”

博客文章称,Gemini 2.5在长上下文性能上以83.1%的成绩遥遥领先。OpenAI的o3-mini得分为61.4%,而GPT-4.5得分为64%。根据文章,谷歌计划不久后将上下文窗口扩大一倍。巴季耶夫说:“如果谷歌确实实现了200万个标记的上下文,即使在较低的基准测试中,这也将是对其他模型前所未有的优势。”

如需获取PYMNTS的所有AI报道,请订阅每日AI新闻简报。

推荐谷歌在“胜者通吃”的AI模型竞赛中推出了备受瞩目的Gemini 2.5。

亚马逊Alexa基金扩大投资范围至包括AI。

国会预算办公室表示八月或九月可能需要调整债务上限。

联邦贸易委员会任命诉讼律师担任竞争和消费者保护角色。

查看更多:安德斯·因德塞人工智能Gemini生成式AI谷歌伊利亚·巴季耶夫创新新闻NjordisPYMNTS新闻技术Trevolution Group

(以上内容均由Ai生成)

你可能还想读

美国能源部 17 个国家实验室全景及创世纪计划战略布局分析

美国能源部 17 个国家实验室全景及创世纪计划战略布局分析

快速阅读: 美国能源部17个国家实验室构成顶尖科研体系,在基础科学、能源安全、气候变化等领域发挥关键作用。拥有全球领先的超算资源及顶尖人才,年经费约220亿美元。随着“创世纪计划”启动,实验室将形成协同网络,推动美国在清洁能源、量子计算等前 […]

发布时间:2025年12月8日
谷歌Gemini 3 Pro发布

谷歌Gemini 3 Pro发布

快速阅读: 谷歌发布新一代推理模型Gemini 3 Pro,显著提升数学、编程和视觉理解能力。一经发布,Gemini 3 Pro几乎横扫各大评测榜单,在LMArena大模型竞技场中以1501的Elo得分高居榜首。在MathArena数学竞赛 […]

发布时间:2025年11月19日
独具创新,直击痛点:深度解析华为十大最新方案

独具创新,直击痛点:深度解析华为十大最新方案

快速阅读: 第三个方案,是华为的U6GHzAAU天线。综合来看,华为的U6GAAU,真正实现了容量覆盖双优,助力全球U6G商用。LampSiteX,是LampSite系列的最新型号。第五个方案,是华为有源天线产品——EasyAAU。Easy […]

发布时间:2025年11月13日
Palantir估值承压仍领跑AI赛道

Palantir估值承压仍领跑AI赛道

快速阅读: 近期,美国AI概念股整体承压,Palantir与英伟达遭遇做空传闻,引发市场短暂震荡。然而,在宏观调整与估值质疑中,Palantir仍凭借强劲业绩与差异化AI布局维持长期增长势头。分析人士认为,该公司正处于由“政府数据支撑”向“ […]

发布时间:2025年11月12日
Palantir与Snowflakes深化AI合作

Palantir与Snowflakes深化AI合作

快速阅读: Snowflake 与 Palantir 宣布建立战略合作,整合双方的数据与AI能力,使企业能够在统一的数据基础上直接调用 Palantir 的AI分析与智能应用工具,加速企业级AI落地。 2025年10月,Snowflake […]

发布时间:2025年11月10日
Palantir与迪拜控股共建AI公司

Palantir与迪拜控股共建AI公司

快速阅读: Dubai Holding 与 Palantir 宣布成立合资公司 Aither,致力于为中东地区政府与企业提供人工智能转型解决方案。该合作标志着 Palantir 在中东技术布局的进一步深化,也为当地公共服务与产业数字化提供新 […]

发布时间:2025年11月10日
Palantir携手Lumen共建企业AI平台

Palantir携手Lumen共建企业AI平台

快速阅读: 2025年10月,Palantir Technologies与Lumen Technologies宣布达成战略合作,联合打造面向企业级应用的人工智能服务平台。双方将以Palantir的Foundry与AIP平台为核心,推动通信与 […]

发布时间:2025年11月7日
Palantir携手Hadean拓展英国国防部AI战场模拟平台

Palantir携手Hadean拓展英国国防部AI战场模拟平台

快速阅读: 2025年10月,数据智能公司 Palantir Technologies 宣布与英国分布式计算企业 Hadean 达成战略合作,双方将共同为英国国防部(UK Ministry of Defence, UK MoD)扩展基于人工 […]

发布时间:2025年11月7日