谷歌在“赢家通吃”AI 模型竞赛中首次推出备受吹捧的 Gemini 2.5
快速阅读: 据《PYMNTS.com》最新报道,谷歌推出最强AI模型Gemini 2.5,在多项基准测试中大幅领先 competitors,具备超强推理和多模态能力,上下文窗口达100万标记,未来将整合至全系列模型并扩展至200万标记,助力复杂任务处理。
谷歌推出了迄今为止最强大的生成式人工智能模型,该模型在行业基准测试中大多表现远超其最坚定的竞争对手,从而在激烈的AI竞赛中开辟了新的战场。作为谷歌家族的一员,Gemini 2.5是其“最智能”的模型,并且在推理能力上大幅领先顶级模型,包括来自OpenAI、Anthropic、Grok和DeepSeek等公司的模型,“领先幅度显著”,谷歌旗下DeepMind首席技术官科尔·卡夫丘古鲁在周三(3月26日)的博客文章中写道。这意味着采用生成式AI模型的企业可以在谷歌云工具箱中使用更强大的工具来构建定制应用程序。“谷歌的Gemini 2.5已经落地——这是一款推理、多模态和原始计算力量的杰作,”投资公司Njordis创始人安德斯·因德塞告诉PYMNTS。谷歌正在“投身于一场不再是短跑而是无情的、胜者通吃的围攻式的AI竞赛。”
在推理和知识方面,Gemini 2.5击败了OpenAI的o3-mini和GPT-4.5、Claude 3.7 Sonnet、Grok 3 Beta和DeepSeek R1。同样的情况也出现在代码编辑、视觉推理、长上下文和多语言性能方面。在科学领域,它击败了所有对手,除了Claude。在数学方面,它仅次于Grok。在代码生成方面,它的表现相对最弱,排名第三。
谷歌即将推出的Gemini 2.5的第一个版本是一个实验性Pro版本。它可供Gemini Advanced付费用户使用,并将很快登陆谷歌云的Vertex AI平台,根据博客文章所述。开发者和企业可以在谷歌AI工作室试用它。阅读更多:谷歌希望到年底拥有5亿Gemini AI用户。
**通过思考得出答案**
Gemini 2.5是一款思考或推理模型,它会在回应之前暂停并循环检查逻辑,以提高答案的准确性和性能。根据文章内容,它分析信息,得出逻辑结论,添加上下文并理解细微差别以作出决策。谷歌的竞争对手已经发布了自己的推理模型,其中包括来自OpenAI、Anthropic、Grok、DeepSeek等公司的模型。谷歌本身也发布了一个名为Gemini 2.0 Flash Thinking的推理模型。然而,根据文章,Gemini 2.5超越了Gemini 2.0 Flash Thinking的推理能力,后者使用了强化学习(奖励正确答案,惩罚错误答案)和思维链提示。文章指出,通过Gemini 2.5,谷歌结合了一个“显著增强的基础模型与改进的后训练”,达到了一个新的性能水平。未来,谷歌将把这些思考能力直接整合到所有模型中,以便它们能够处理“复杂问题并支持更强大、情境感知的代理”。
同样地:谷歌的Gemini 2.0承诺自主控制复杂业务任务75万字的提示。
**与谷歌其他Gemini模型一样,Gemini 2.5是原生多模态的,这意味着它可以分析和理解文本、音频、视频、图像和代码——这些能力是从底层构建的,而不是附加的。**
Gemini 2.5还提供了100万个标记的上下文窗口(约75万英文单词),因此它可以接受非常长的提示,这一功能仅在阿里巴巴的一些Qwen生成式AI模型中可以匹配。“上下文窗口对于AI竞赛来说至关重要,”Trevolution Group数据科学主管伊利亚·巴季耶夫告诉PYMNTS。“上下文长度是[AI模型]实际应用中最关键的参数之一。”巴季耶夫说:“有了更大的上下文,模型可以更好地协助编程、回答问题和文本生成——基本上任何事情都可以。”
博客文章称,Gemini 2.5在长上下文性能上以83.1%的成绩遥遥领先。OpenAI的o3-mini得分为61.4%,而GPT-4.5得分为64%。根据文章,谷歌计划不久后将上下文窗口扩大一倍。巴季耶夫说:“如果谷歌确实实现了200万个标记的上下文,即使在较低的基准测试中,这也将是对其他模型前所未有的优势。”
如需获取PYMNTS的所有AI报道,请订阅每日AI新闻简报。
推荐谷歌在“胜者通吃”的AI模型竞赛中推出了备受瞩目的Gemini 2.5。
亚马逊Alexa基金扩大投资范围至包括AI。
国会预算办公室表示八月或九月可能需要调整债务上限。
联邦贸易委员会任命诉讼律师担任竞争和消费者保护角色。
查看更多:安德斯·因德塞人工智能Gemini生成式AI谷歌伊利亚·巴季耶夫创新新闻NjordisPYMNTS新闻技术Trevolution Group
(以上内容均由Ai生成)