谷歌推出 Gemini 2.5 Pro,突破 AI 推理的界限

发布时间:2025年3月27日    来源:szf
谷歌推出 Gemini 2.5 Pro,突破 AI 推理的界限

快速阅读: 据《福布斯》最新报道,谷歌推出双子座2.5Pro AI模型,具备强大的推理和编码能力。该模型在多个行业基准测试中表现出色,支持复杂任务处理。谷歌还发布了TxGemma套件,用于药物和生物技术领域,助力研发决策。双子座2.5Pro为企业提供了通用智能和专业技能,推动创新和竞争优势。

双子座2.5Pro
谷歌旗下的深度思维推出了最新大规模多模态AI模型——双子座2.5Pro,该模型内置“思考”能力,能够处理复杂任务。作为双子座2.5系列的首次发布,Pro版本在多个行业基准测试中大幅领先,并展现出强大的推理和编码能力。

与早期仅依赖模式预测文本的AI不同,双子座2.5Pro被设计为深入分析信息、得出逻辑结论、整合细微上下文并做出明智决策后再回应。这种设计理念使双子座2.5Pro成为一款高度先进的通用型模型,非常适合需要准确性和适应性的企业应用场景。

双子座2.5Pro的核心优势在于其架构设计的根本转变,即向谷歌所称的“思考模型”迈进。这标志着从传统专注于预测和分类的AI模型转向一种在生成回应前进行内部权衡和推理的系统。这种有意识的设计方法显著提升了性能和准确性,尤其是在处理需要超越简单模式识别的复杂任务时。

除了抽象推理之外,双子座2.5Pro还提供了一系列与企业需求直接相关的高级功能。其中一项亮点是其编码能力的显著提升。谷歌工程师表示,从双子座2.0到2.5,编码表现有了大幅提升,并且未来还有更多改进空间。2.5Pro版本擅长生成和优化代码,能够仅凭高层次提示就创建复杂的软件,例如一个功能齐全的互动网页应用。在一次演示中,该模型仅用单行提示就开发出了完整的“无尽跑酷”游戏(HTML/JS),展示了其自主管理项目级编码任务的能力。此外,双子座2.5Pro在稳健的代码转换和编辑方面也表现出色,对于重构遗留代码或在语言间翻译代码等任务非常有价值。在一个标准化的软件工程基准测试(SWE-Bench Verified)中,该模型以自主代理设置取得了高分(63.8%),表明其在解决复杂、多步骤编码挑战方面的实力。对企业而言,这意味着AI不仅能充当对话助手,还能作为高效的编码助手,甚至是一种半自主的软件代理。

作为双子座生态系统的一部分,谷歌还推出了TxGemma套件,这是一组面向特定行业挑战的开放模型。TxGemma是基于轻量级Gemma系列(开源版双子座技术)构建的模型集合,专门针对治疗药物和生物技术开发。这些模型经过训练,能够理解和预测潜在药物及基因疗法的属性,帮助研究人员识别有前景的候选者,甚至预测临床试验结果。

本质上,TxGemma将双子座的核心语言建模和推理技术应用于制药领域,在这里它能筛选生物医学文献、化学数据和试验结果,协助研发决策。最大的TxGemma模型(拥有270亿参数)在许多药物发现任务上的表现与或超过了专门模型,同时保留了通用推理能力。对于医疗保健和生命科学领域的领导者来说,TxGemma展示了双子座架构在关键任务领域中的适应性——它展示了如何通过尖端AI加速像药物发现这样耗时且成本高昂的传统工作流程。

双子座2.5Pro代表了AI模型设计的重大进步,结合了原始计算能力和经过打磨的推理能力,直接应对复杂的真实世界任务。其架构——具有原生多模态性和前所未有的上下文长度——使企业能够运用更丰富的数据来解决问题,挖掘出之前模型可能忽略的见解。该模型在编码和推理基准测试中的强劲表现,增强了人们对其在自动化部分软件工程以及解读广泛企业知识库方面的信心。随着谷歌通过云平台支持企业集成以及出现如TxGemma这样的领域专用分支,双子座2.5Pro生态系统正准备提供现代企业所需的通用智能和专业技能。对于制定公司AI战略的首席执行官们而言,双子座2.5Pro预示着下一代AI系统如何部署以推动创新和竞争优势——这一切都聚焦于更深的推理、更广的上下文以及可衡量的结果。

(以上内容均由Ai生成)

你可能还想读

本周科技大事件:谷歌发布Pixel 10,Gamescom揭晓重磅游戏

本周科技大事件:谷歌发布Pixel 10,Gamescom揭晓重磅游戏

快速阅读: 谷歌推出Pixel 10手机及Pixel Watch 4,新增卫星紧急通讯、可更换电池和屏幕、抬手通话等功能,屏幕亮度达3000尼特,还将与斯蒂芬·库里合作推出AI健康和健身教练服务。 谷歌本周在“由谷歌制造”活动中推出了Pix […]

发布时间:2025年8月23日
SK海力士凭借HBM激增首次超越三星,领跑全球内存市场

SK海力士凭借HBM激增首次超越三星,领跑全球内存市场

快速阅读: 据《《韩国先驱报》》称,7月20日,SK海力士首登全球内存芯片市场榜首,受益于AI产品和HBM芯片领先地位。其季度利润达9.2万亿韩元,远超三星。 据韩联社报道,7月20日,韩国京畿道伊川,SK海力士首次登上全球内存芯片市场榜首 […]

发布时间:2025年8月1日
STAN 从谷歌、万代南梦宫和其他公司筹集了 850 万美元

STAN 从谷歌、万代南梦宫和其他公司筹集了 850 万美元

快速阅读: 据《印度教业务线》称,STAN获850万美元融资,由万代南梦宫等机构投资。计划拓展印度市场,加强AI功能与创作者工具。平台用户超2500万,专注移动端社交游戏。 记者获悉,8月1日,社交游戏平台STAN宣布完成850万美元的新一 […]

发布时间:2025年8月1日
“这改变了一切”:谷歌的人工智能模式迫使品牌重新考虑搜索策略

“这改变了一切”:谷歌的人工智能模式迫使品牌重新考虑搜索策略

快速阅读: 据《营销周》称,谷歌推出AI搜索模式,减少外部链接,提升对话式回答。品牌需调整策略,重视内容质量与品牌权威。此变化影响营销方式,竞争加剧。 据谷歌官方消息,7月29日,谷歌在英国推出了基于人工智能的搜索功能AI模式,此前该功能已 […]

发布时间:2025年8月1日
在 Android 上用更智能的应用程序替换 Google Assistant

在 Android 上用更智能的应用程序替换 Google Assistant

快速阅读: 据《电话竞技场》称,据报道,用户可从Google Play下载Meta AI应用,安装后需检查版本是否为230.0.0.36.164或更高。操作方法:进入设置,选择应用,查看Meta AI信息页底部的版本号。 据媒体报道,用户现 […]

发布时间:2025年8月1日
Xero 的英国董事总经理回击人工智能正在抢走会计工作的说法

Xero 的英国董事总经理回击人工智能正在抢走会计工作的说法

快速阅读: 据《UKTN(英国科技新闻)》称,英国科技媒体UKTN报道,Xero英国总经理凯特·海沃德表示,会计行业无需过度担忧AI自动化。尽管四大事务所裁员,但Xero仍持续投资AI技术,提升效率与服务质量。 据英国科技新闻网站UKTN报 […]

发布时间:2025年8月1日
Reddit 计划在搜索引擎市场大力推动人工智能与谷歌竞争:报告

Reddit 计划在搜索引擎市场大力推动人工智能与谷歌竞争:报告

快速阅读: 据《商业标准》称,Reddit CEO表示,公司正将平台转型为搜索引擎,整合AI功能,提升用户体验。Reddit Answers用户已超600万,计划全球推广。 据《The Verge》报道,7月11日,Reddit首席执行官史 […]

发布时间:2025年8月1日
Meta 超出预期,为“个人超级智能”做准备

Meta 超出预期,为“个人超级智能”做准备

快速阅读: 据《RCR无线》称,Meta二季度营收475.2亿美元,净利润183亿美元。CEO扎克伯格称将打造个人超级智能,但数据中心扩容遇挑战。公司计划2025年支出达1140-1180亿美元。 据媒体报道,7月25日,美国加州,社交媒体 […]

发布时间:2025年8月1日