谷歌Gemini2.5音频模型函数调用准确率超OpenAI

发布时间:2025年12月18日    来源:szf
谷歌Gemini2.5音频模型函数调用准确率超OpenAI

快速阅读: 据谷歌消息,其Gemini 2.5 Flash Native Audio模型完成重大升级,可直接处理语调与情感,无需语音转文字,指令遵循率提升至90%;在ComplexFuncBench测试中,准确率优于OpenAI竞品,现已接入Google AI Studio等平台供开发者调用。

谷歌本周宣布对其原生音频模型Gemini 2.5 Flash Native Audio进行重大更新,旨在推动AI交互从“文本转语音”迈向拟人化的实时对话。

此次升级的核心在于“原生”音频处理能力。该模型无需先将语音转为文字,可直接感知语调、情感与停顿,显著提升对话的自然度与流畅性。

数据显示,新版本对开发者指令的遵循率由84%提升至90%,在多步骤工作流中表现更为精准。在音频基准测试ComplexFuncBench中,其函数调用准确率达71.5%,优于OpenAI的gpt-realtime(66.5%),凸显其在实时语音代理领域的竞争力。

目前,该技术已全面接入Google AI Studio、Vertex AI、Gemini Live及Search Live。开发者可通过Gemini API调用升级版模型,利用其增强的多轮对话记忆与情绪感知能力,构建更可靠、更具人性化的AI助手。

(以上内容均由Ai生成)

引用自:AIbase人工智能资讯平台

你可能还想读

埃森哲停止披露AI收入但Q1增长强劲

埃森哲停止披露AI收入但Q1增长强劲

快速阅读: 埃森哲公司在声明中表示,其2026财年一季度新订单达209亿美元,先进AI相关订单同比激增76%至22亿美元,营收达187.4亿美元并触及指引上限。公司称AI已深度融入整体业务,将不再单独披露相关数据。 埃森哲公司于近日发布20 […]

发布时间:2025年12月19日
Coursera与Udemy合并加速AI人才培养

Coursera与Udemy合并加速AI人才培养

快速阅读: 据官方透露,受人工智能快速发展影响,企业正转向模块化培训以提升员工AI技能。优达学城与Coursera合并后将构建统一技能记录系统,助力企业动态追踪并培养人才,增强应对技术变革的能力。 近日,亚马逊旗下AWS培训与认证项目董事总 […]

发布时间:2025年12月19日
微软Copilot假日广告承诺落空

微软Copilot假日广告承诺落空

快速阅读: 截至发稿时,用户反映微软Copilot在将食谱份量扩增至14人份时计算中断,并误将网页上的整数倍按钮识别为精确调节控件,最终未能输出调整后的食材清单,暴露出其在连续数值处理与界面理解方面的不足。 近日,有用户反映在使用人工智能助 […]

发布时间:2025年12月19日
谷歌Home应用支持批量迁移Nest设备

谷歌Home应用支持批量迁移Nest设备

快速阅读: 据谷歌消息,Google Home应用现已支持一次性迁移多台旧版Nest设备,涵盖恒温器、摄像头、智能门锁及烟雾报警器,大幅简化此前繁琐的手动操作流程,以加速向统一平台整合并优化用户体验。 谷歌近日在更新日志中宣布,Google […]

发布时间:2025年12月19日
美光称存储芯片短缺将持续至2026年后

美光称存储芯片短缺将持续至2026年后

快速阅读: 据官方透露,亚马逊数字广告平台在美国月活广告受众超3亿,依托Prime Video原创内容及与Netflix等平台的合作,覆盖用户全链路场景,并通过互动广告与营销云AI技术提升品牌营销精准度。 亚马逊数字广告平台(Amazon […]

发布时间:2025年12月19日
Patronus AI推出智能体训练模拟器

Patronus AI推出智能体训练模拟器

快速阅读: 据Patronus AI消息,该公司本月推出“生成式模拟器”,通过动态创建任务与实时更新规则,构建“活态”训练场以提升AI智能体的任务执行能力,并提出“开放递归自改进”机制,支持智能体在无需重训练的情况下持续优化。 人工智能领域 […]

发布时间:2025年12月19日
联想AI战略的五大落地路径

联想AI战略的五大落地路径

快速阅读: 据官方透露,联想集团正系统推进AI规模化应用,已注册超1000个相关项目,并通过“组合式”策略覆盖从试点到全公司推广的全周期。为应对数据监管与技术不确定性,公司强化区域化部署,建立AI工具白名单机制,并将AI目标纳入高管考核,以 […]

发布时间:2025年12月19日
Lovable融资3.3亿美元估值达66亿

Lovable融资3.3亿美元估值达66亿

快速阅读: 截至报道时,据媒体消息,瑞典AI初创公司Lovable完成3.3亿美元B轮融资,估值达66亿美元。其“氛围编程”工具已吸引Uber等客户,日均新增项目超10万个,新资金将用于拓展企业功能与基础设施。 瑞典人工智能初创企业Lova […]

发布时间:2025年12月19日