Gemini 2.5 Pro 更新在 Google I/O 发布之前提升编码能力
快速阅读: 据《CNET 公司》最新报道,谷歌将在I/O大会发布升级版Gemini 2.5 Pro,编码能力增强。谷歌、Anthropic、Meta和OpenAI在基准测试中竞争激烈,但批评者认为这些测试未必反映真实效果。尽管如此,Gemini 2.5 Pro受到好评,Reddit用户也反馈其仍有不按指令行事的问题。
谷歌将在其年度开发者大会Google I/O之前发布Gemini 2.5 Pro的升级版本,并声称其编码能力有了显著提高。谷歌在周二的新闻稿中表示,Gemini 2.5 Pro预览版(I/O 版)特别擅长构建引人注目的互动网页应用。这是谷歌与其人工智能竞争对手在这一领域激烈竞争的一部分。
今年2月,谷歌推出了Gemini免费代码助手,该模型每月可提供高达18万次完成的近乎无限制使用量。不过,要充分利用这一功能,用户每天需要连续编程14小时。Gemini 2.5 Pro中的编码助手是一个更强大的选择,谷歌表示Gemini 2.5 Pro现在在网页开发领域的排行榜上处于领先地位,超越了其前一版本。谷歌、Anthropic、Meta以及OpenAI(ChatGPT的制造商)一直在基准测试排行榜上展开竞争。对于这些公司而言,这是一项重要的指标,显示谁在该领域占据主导地位,并推动后续的资金投入与研发。
然而,批评者指出,基准测试工具并不能完全反映实际现实世界中的有效性,而大型科技公司似乎更多地是在针对基准测试调整人工智能模型,而非根据人们实际使用AI的方式进行优化。一些专家呼吁人工智能公司在基准测试时采用不同的标准,不要过于关注高深学术分析或抽象数学,而是更多地关注贴近实际需求的测试参数。
尽管如此,排行榜的竞争确实为消费者和企业客户提供了某种关于不同人工智能模型表现如何的指示。“我们对最新的Gemini 2.5 Pro感到兴奋,它进一步增强了其在现实世界编码方面的能力。”谷歌Gemini项目管理高级总监图尔西·多希在一份声明中说道。“我们内部观察到,新模型在调用工具失败率上有显著降低,我们认为我们的用户会发现这使得2.5 Pro在Cursor中比以往任何时候都更加有效。”Cursor是一个由人工智能驱动的编程环境。谷歌表示,Gemini 2.5 Pro受到了非常积极的反馈。
与此同时,Reddit上的用户报告称,Gemini 2.5 Pro依然存在自行其是、不按指令行事的问题。
(以上内容均由Ai生成)