英伟达发布OmniVinci,全模态理解刷新SOTA

发布时间:2025年10月28日    来源:szf
英伟达发布OmniVinci,全模态理解刷新SOTA

快速阅读: 英伟达发布 OmniVinci 全模态理解模型,性能超现有顶尖模型19.05分,训练数据仅需1/6,创新全模态对齐机制,显著提升数据效率。

英伟达研究团队今日发布了名为 OmniVinci 的全模态理解模型。该模型在关键的全模态理解基准测试中取得了显著成绩,比现有顶尖模型高出19.05分。尤为突出的是,OmniVinci 仅使用了1/6的训练数据,展现了卓越的数据效率和性能。

OmniVinci 的目标是构建一个能够同时理解视觉、音频和文本的全能 AI 系统,使机器能够像人类一样通过多种感官感知并理解复杂世界。为此,英伟达团队采用了创新的架构设计和数据管理策略,通过一个统一的全模态潜在空间,将不同感官的信息融合在一起,实现了跨模态的理解和推理。

在 Dailyomni 基准测试中,OmniVinci 的表现超越了 Qwen2.5-Omni,在音频理解的 MMAR 测试中高出1.7分,在视觉理解的 Video-MME 测试中高出3.9分。OmniVinci 的训练所用的 Token 数量仅为0.2万亿,而 Qwen2.5-Omni 的训练量为1.2万亿,显示 OmniVinci 的训练效率是其6倍。

该模型的核心创新在于全模态对齐机制,包括 OmniAlignNet 模块、时间嵌入分组(TEG)和约束旋转时间嵌入(CRTE)三项技术。OmniAlignNet 利用了视觉和音频信号之间的互补性,增强了两者的学习与对齐。TEG 通过将视觉和音频信息按时间分组,有效地编码了时间关系。CRTE 解决了时间对齐问题,确保模型能理解事件的绝对时间信息。

研究团队采用了两阶段的训练方法,先进行模态特定训练,再进行全模态联合训练,逐步提升模型的全模态理解能力。在隐式全模态学习方面,研究者利用现有的视频问答数据集,进一步提升了模型对音视频的联合理解能力。

OmniVinci 的推出标志着英伟达在多模态 AI 领域的重大突破,预计将在各类应用中推动 AI 技术的发展,促进更智能系统的出现。该模型的开源发布,也将为全球研究人员和开发者提供新的机会,推动 AI 在实际应用中的进一步探索与创新。

(以上内容均由Ai生成)

你可能还想读

博通重燃AI盈利担忧拖累科技股

博通重燃AI盈利担忧拖累科技股

快速阅读: 据公开信息显示,美国股市周五回落,标普500指数和纳斯达克指数从历史高点回调,因市场担忧AI盈利前景及博通股价大跌,资金转向其他板块。 美国股市周五回落,标普500指数与纳斯达克综合指数均从历史高点回调。市场对人工智能领域盈利前 […]

发布时间:2025年12月15日
特朗普力推AI经济,选民却忧心忡忡

特朗普力推AI经济,选民却忧心忡忡

快速阅读: 据10a Labs旗下Data Center Watch统计,2025年第二季度因地方反对受阻的数据中心项目投资额达980亿美元,创历史新高,反映出AI基建热潮正遭遇基层民生担忧与政治阻力。 美国总统特朗普在2026年大选临近之 […]

发布时间:2025年12月15日
中国建成全球最大AI超算网络

中国建成全球最大AI超算网络

快速阅读: 据业内人士透露,中国正式启用全球规模最大的人工智能分布式计算中心“未来网络试验设施”,覆盖40城、跨度超2000公里,通过高速光缆整合算力,训练千亿参数AI模型的效率大幅提升,整体周期缩短数月,支撑工业、医疗等实时应用,助力国家 […]

发布时间:2025年12月15日
亚马逊下架错误百出的AI剧情回顾

亚马逊下架错误百出的AI剧情回顾

快速阅读: 据多方消息,亚马逊为节省成本使用AI生成剧集回顾视频,却因事实错误引发批评,如将《辐射》核战时间错标为1950年代而非2077年,暴露其在自动化内容中忽视质量把控的问题。 亚马逊近期因使用人工智能生成的短视频替代人工制作内容引发 […]

发布时间:2025年12月15日
博通AI订单强劲提振分析师信心

博通AI订单强劲提振分析师信心

快速阅读: 据官方通报,博通AI业务持续扩张,订单积压达740亿美元,获美银和杰富瑞等机构看好,预计2026至2027财年AI销售额将达500亿至1000亿美元,客户群拓展及新项目放量支撑其长期增长。 博通公司近期发布财报后获得多家分析机构 […]

发布时间:2025年12月15日
AI热潮与互联网泡沫的相似之处

AI热潮与互联网泡沫的相似之处

快速阅读: 据摩根大通消息,当前AI热潮虽引发对泡沫风险的担忧,但与2000年互联网泡沫存在本质差异:主导企业如英伟达、谷歌等具备稳健盈利能力和万亿美元级市值,且市场警惕情绪或成稳定因素。 20世纪90年代中期兴起的互联网热潮推动了全球数字 […]

发布时间:2025年12月15日
特朗普行政令威胁制裁制定“过度”AI法规的州

特朗普行政令威胁制裁制定“过度”AI法规的州

快速阅读: 截至目前,公共公民组织联合主席罗伯特·魏斯曼批评大型科技企业获得政策优待,指出其背离特朗普阵营标榜的联邦主义原则;该行业近年投入超11亿美元用于政治游说,并深度介入政府AI政策制定,魏斯曼呼吁加强监管以维护公共利益。 罗伯特·魏 […]

发布时间:2025年12月15日
时代》致敬AI奠基者

时代》致敬AI奠基者

快速阅读: 据《时代》杂志报道,人工智能获评2025年度人物,因其正深刻改变人类的工作与思考方式;生成式AI推动其从实验室走向大众应用,英伟达跃居全球市值最高公司,专家呼吁在发展的同时关注就业影响与全球治理。 人工智能被《时代》杂志评为20 […]

发布时间:2025年12月15日