谷歌公开提供其推理优化的 Gemini 2.5 Pro 模型

发布时间：2025年4月5日来源：szf

快速阅读: 《硅角度》消息，谷歌开放Gemini 2.5 Pro公测版，提升速率限制并引入付费模式；OpenAI计划推出两款新模型及后续的GPT-5以应对竞争。

谷歌公司今日宣布，其上个月推出的高级大型语言模型Gemini 2.5 Pro的公开预览版现已开放。在此之前，该LLM（大型语言模型）仅能通过一个使用限制极低的免费API访问。开发者每天最多只能发送25次请求，每分钟最多5次。Gemini 2.5 Pro的新公开预览版本引入了付费层级，大幅提升了速率限制。据谷歌称，开发者现在可以每分钟向模型发送最多2000个请求，并且没有每日上限。Gemini 2.5 Pro每分钟能够处理多达800万个标记的数据。这使得该模型适合用于支持拥有大量用户的生产应用。

对于包含最多20万个标记的提示，谷歌对每百万个输入标记收费1.25美元，对每百万个输出标记收费15美元。当提示标记数超过20万时，上述费用分别升至2.5美元和15美元。谷歌的定价策略使Gemini 2.5 Pro的价格高于DeepSeek-R1，但低于Anthropic PBC的Claude 3.7 Sonnet。“Gemini 2.5 Pro的试用版本仍然免费，但速率限制较低”，谷歌高级产品经理Logan Kilpatrick今日在其博客中写道。上个月首次推出时，Gemini 2.5 Pro在广受欢迎的LMArena LLM基准测试中大幅领先。该基准测试基于用户反馈来比较AI模型的表现。Gemini 2.5 Pro还在AIME 2025考试中取得了86.7%的分数，这是美国数学奥林匹克竞赛的资格考试。值得一提的是，谷歌表示，该LLM在未使用“测试时间技术”的情况下超过了多个推理优化模型。“测试时间计算”是一种机器学习方法，通过增加完成任务所需的时间和硬件资源来提升LLM的输出质量。该技术可能会显著增加推理成本。

内部而言，Gemini 2.5 Pro是谷歌去年12月推出的Gemini 2.0 Pro模型的升级版。按照这家搜索巨头的说法，其工程师提升了基础模型并改进了训练后的流程。训练后指在模型训练完成后，通过提供额外数据提升其输出质量的过程。谷歌的Gemini模型系列和开源LLM如R1正在给OpenAI带来更大的竞争压力。

为了保持市场地位，ChatGPT的开发者将在未来两周内发布两款新的推理模型。OpenAI首席执行官Sam Altman今日在X平台发文详细说明了这一计划。该公司计划发布其去年12月展示的o3推理模型，以及一款此前未公布的名为o4-mini的LLM。OpenAI原本并无计划单独提供o3服务。数月后，该公司将通过发布GPT-5跟进这两款模型。它被描述为一个融合了推理优化的o3模型及其他功能的AI系统。OpenAI将用GPT-5驱动ChatGPT的免费版和付费版。

图片：谷歌

来自硅谷立方体联合创始人John Furrier的消息：“您的支持对我们非常重要，它帮助我们保持内容免费。只需点击一下即可支持我们的使命，即提供免费、深入且相关的内容。加入我们的YouTube社区，加入包括超过15,000名#CubeAlumni专家的社区，其中包括亚马逊CEO安迪·贾西、戴尔科技创始人兼CEO迈克尔·戴尔、英特尔CEO帕特·格尔辛格等众多名人和专家。”

“立方体是我们行业的重要合作伙伴。你们确实是我们的活动的一部分，我们非常感谢你们的到来，我知道人们也欣赏你们创造的内容。”——安迪·贾西

谢谢您！

(以上内容均由Ai生成)