谷歌公开提供其推理优化的 Gemini 2.5 Pro 模型
快速阅读: 《硅角度》消息,谷歌开放Gemini 2.5 Pro公测版,提升速率限制并引入付费模式;OpenAI计划推出两款新模型及后续的GPT-5以应对竞争。
谷歌公司今日宣布,其上个月推出的高级大型语言模型Gemini 2.5 Pro的公开预览版现已开放。在此之前,该LLM(大型语言模型)仅能通过一个使用限制极低的免费API访问。开发者每天最多只能发送25次请求,每分钟最多5次。Gemini 2.5 Pro的新公开预览版本引入了付费层级,大幅提升了速率限制。据谷歌称,开发者现在可以每分钟向模型发送最多2000个请求,并且没有每日上限。Gemini 2.5 Pro每分钟能够处理多达800万个标记的数据。这使得该模型适合用于支持拥有大量用户的生产应用。
对于包含最多20万个标记的提示,谷歌对每百万个输入标记收费1.25美元,对每百万个输出标记收费15美元。当提示标记数超过20万时,上述费用分别升至2.5美元和15美元。谷歌的定价策略使Gemini 2.5 Pro的价格高于DeepSeek-R1,但低于Anthropic PBC的Claude 3.7 Sonnet。“Gemini 2.5 Pro的试用版本仍然免费,但速率限制较低”,谷歌高级产品经理Logan Kilpatrick今日在其博客中写道。上个月首次推出时,Gemini 2.5 Pro在广受欢迎的LMArena LLM基准测试中大幅领先。该基准测试基于用户反馈来比较AI模型的表现。Gemini 2.5 Pro还在AIME 2025考试中取得了86.7%的分数,这是美国数学奥林匹克竞赛的资格考试。值得一提的是,谷歌表示,该LLM在未使用“测试时间技术”的情况下超过了多个推理优化模型。“测试时间计算”是一种机器学习方法,通过增加完成任务所需的时间和硬件资源来提升LLM的输出质量。该技术可能会显著增加推理成本。
内部而言,Gemini 2.5 Pro是谷歌去年12月推出的Gemini 2.0 Pro模型的升级版。按照这家搜索巨头的说法,其工程师提升了基础模型并改进了训练后的流程。训练后指在模型训练完成后,通过提供额外数据提升其输出质量的过程。谷歌的Gemini模型系列和开源LLM如R1正在给OpenAI带来更大的竞争压力。
为了保持市场地位,ChatGPT的开发者将在未来两周内发布两款新的推理模型。OpenAI首席执行官Sam Altman今日在X平台发文详细说明了这一计划。该公司计划发布其去年12月展示的o3推理模型,以及一款此前未公布的名为o4-mini的LLM。OpenAI原本并无计划单独提供o3服务。数月后,该公司将通过发布GPT-5跟进这两款模型。它被描述为一个融合了推理优化的o3模型及其他功能的AI系统。OpenAI将用GPT-5驱动ChatGPT的免费版和付费版。
图片:谷歌
来自硅谷立方体联合创始人John Furrier的消息:“您的支持对我们非常重要,它帮助我们保持内容免费。只需点击一下即可支持我们的使命,即提供免费、深入且相关的内容。加入我们的YouTube社区,加入包括超过15,000名#CubeAlumni专家的社区,其中包括亚马逊CEO安迪·贾西、戴尔科技创始人兼CEO迈克尔·戴尔、英特尔CEO帕特·格尔辛格等众多名人和专家。”
“立方体是我们行业的重要合作伙伴。你们确实是我们的活动的一部分,我们非常感谢你们的到来,我知道人们也欣赏你们创造的内容。”——安迪·贾西
谢谢您!
(以上内容均由Ai生成)