英伟达发布 OmniVinci,全模态理解超越顶尖模型19.05分

发布时间:2025年10月28日    来源:szf
英伟达发布 OmniVinci,全模态理解超越顶尖模型19.05分

快速阅读: 英伟达发布OmniVinci全模态理解模型,测试成绩领先19.05分,数据效率是竞品六倍。该模型通过创新架构和两阶段训练,实现视觉、音频和文本的跨模态理解。

近日,英伟达研究团队发布了全新的 OmniVinci 全模态理解模型,该模型在多个全模态理解基准测试中,表现出色,超越了目前最 顶尖 的模型19.05分。更令人瞩目的是,OmniVinci 在训练过程中仅使用了0.2万亿的训练 Token,相较于竞争对手的1.2万亿,其数据效率是其六倍。

OmniVinci 的核心目标是打造一个可以同时理解视觉、音频和文本的人工智能系统,使机器能够像人类一样,通过不同感官感知和理解复杂的世界。为了实现这一目标,研究团队不仅仅是简单地增加数据量,而是通过创新的网络架构和数据管理策略,成功实现了性能和效率的双重提升。

在设计上,OmniVinci 采用了全模态潜在空间的概念,旨在融合来自不同感官的信息,实现跨模态的理解与推理。研究团队发现,不同模态之间在感知和推理层面能够相互强化,这一发现为多模态 AI 系统的构建指明了方向。

OmniVinci 的架构设计具有可组合的跨模态理解能力,整合了图像、视频、音频和文本等异构输入。通过统一的全模态对齐机制,该模型能够将不同模态的嵌入信息整合到一个潜在空间中,进一步输入到大语言模型(LLM)中。该机制包括三项关键技术,其中 OmniAlignNet 模块有效对齐视觉和音频信息,而时间嵌入分组和约束旋转时间嵌入则提升了模型对时间信息的理解。

为了培养 OmniVinci 的全模态理解能力,研究团队采用了两阶段的训练方法。首先是模态特定训练,接着进行全模态联合训练,利用隐式和显式学习数据,显著提升了模型的联合理解能力。

随着 OmniVinci 的发布,英伟达再次展示了其在人工智能领域的技术创新,预示着未来 AI 系统将更加智能、灵活。

github:https://github.com/NVlabs/OmniVinci 划重点: 🌟 OmniVinci 模型在全模态理解基准测试中超越了 顶尖 模型19.05分。

📊 训练数据量仅为竞争对手的1/6,数据效率提升至六倍。

🔑 采用创新架构和两阶段训练方法,显著提升模型的多模态理解能力。

(以上内容均由Ai生成)

你可能还想读

马斯克称三星德州工厂设备领先台积电,特斯拉AI5芯片将双源生产

马斯克称三星德州工厂设备领先台积电,特斯拉AI5芯片将双源生产

快速阅读: 特斯拉宣布在美国生产AI5处理器,将由台积电和三星代工,确保芯片供应充足。马斯克称AI5性能是AI4的40倍,适用于汽车、机器人和数据中心。三星德克萨斯工厂比台积电亚利桑那工厂更先进。 上周,埃隆·马斯克宣布特斯拉将在美国生产其 […]

发布时间:2025年10月29日
GitHub推出Agent HQ,统一管理多AI工具提升开发效率

GitHub推出Agent HQ,统一管理多AI工具提升开发效率

快速阅读: GitHub与OpenAI在GitHub Universe活动上宣布将Codex集成至GitHub,推出“Agent HQ”平台,支持开发者统一管理多个AI代理,如Codex、Claude和Jules,增强开发工具的融合度,提升 […]

发布时间:2025年10月29日
美银称甲骨文成第四大AI超大规模供应商

美银称甲骨文成第四大AI超大规模供应商

快速阅读: 甲骨文与OpenAI达成3000亿美元交易,加速资本支出和GPU密度提升,巩固AI基础设施市场地位。预计2028年AI市场支出达2000亿美元,甲骨文策略提供高项目经济性,内部收益率可达16%。 据美国银行分析师称,甲骨文公司( […]

发布时间:2025年10月29日
英软件开发者对AI持谨慎态度,安全与质量成顾虑焦点

英软件开发者对AI持谨慎态度,安全与质量成顾虑焦点

快速阅读: JetBrains报告显示,全球85%开发者常用AI编码,但英国开发者态度更为谨慎,不使用AI工具的比例是全球平均水平的两倍多,主要担忧代码质量和安全性。 据 JetBrains 称,人工智能(AI)正在成为开发者生活中的“标准 […]

发布时间:2025年10月29日
微软获OpenAI 27%股权,双方深化合作

微软获OpenAI 27%股权,双方深化合作

快速阅读: OpenAI完成重组,转型为公共利益公司,微软获27%股份及至2032年的技术访问权,包括AGI模型。协议解除资本限制,微软放弃云计算排他性。 OpenAI已完成其盈利性重组,将其盈利部分转变为OpenAI集团公共利益公司,仍由 […]

发布时间:2025年10月29日
帕兰蒂尔股价五年飙升1620%,AI软件成增长引擎

帕兰蒂尔股价五年飙升1620%,AI软件成增长引擎

快速阅读: Palantir Technologies近年来股价飙升,今年涨幅超149%,五年涨1620%。强劲业绩源于AI软件在公共和私营部门的热销。 Palantir Technologies (PLTR 0.04%) 近年来一直是股市 […]

发布时间:2025年10月29日
OpenAI资本重组完成,基金会控股估值1300亿,微软深化合作

OpenAI资本重组完成,基金会控股估值1300亿,微软深化合作

快速阅读: OpenAI完成资本重组,非营利机构改名为OpenAI基金会,持有营利实体股份,估值1300亿美元。基金会与营利业务共享使命,支持健康研究和AI韧性技术,促进AI技术安全普及。 10月28日,IT之家报道,OpenAI宣布完成资 […]

发布时间:2025年10月29日
高通宣布进军AI芯片市场,股价大涨11%

高通宣布进军AI芯片市场,股价大涨11%

快速阅读: 高通宣布明年推出AI200和AI250芯片,进军AI加速器市场,股价因此上涨11%。新芯片主要用于推理任务,旨在降低数据中心能源成本,与英伟达、AMD竞争。 高通宣布计划明年进入竞争激烈的AI加速器芯片市场,扩大其在移动无线连接 […]

发布时间:2025年10月29日