英伟达发布 OmniVinci,全模态理解超越顶尖模型19.05分

发布时间:2025年10月28日    来源:szf
英伟达发布 OmniVinci,全模态理解超越顶尖模型19.05分

快速阅读: 英伟达发布OmniVinci全模态理解模型,测试成绩领先19.05分,数据效率是竞品六倍。该模型通过创新架构和两阶段训练,实现视觉、音频和文本的跨模态理解。

近日,英伟达研究团队发布了全新的 OmniVinci 全模态理解模型,该模型在多个全模态理解基准测试中,表现出色,超越了目前最 顶尖 的模型19.05分。更令人瞩目的是,OmniVinci 在训练过程中仅使用了0.2万亿的训练 Token,相较于竞争对手的1.2万亿,其数据效率是其六倍。

OmniVinci 的核心目标是打造一个可以同时理解视觉、音频和文本的人工智能系统,使机器能够像人类一样,通过不同感官感知和理解复杂的世界。为了实现这一目标,研究团队不仅仅是简单地增加数据量,而是通过创新的网络架构和数据管理策略,成功实现了性能和效率的双重提升。

在设计上,OmniVinci 采用了全模态潜在空间的概念,旨在融合来自不同感官的信息,实现跨模态的理解与推理。研究团队发现,不同模态之间在感知和推理层面能够相互强化,这一发现为多模态 AI 系统的构建指明了方向。

OmniVinci 的架构设计具有可组合的跨模态理解能力,整合了图像、视频、音频和文本等异构输入。通过统一的全模态对齐机制,该模型能够将不同模态的嵌入信息整合到一个潜在空间中,进一步输入到大语言模型(LLM)中。该机制包括三项关键技术,其中 OmniAlignNet 模块有效对齐视觉和音频信息,而时间嵌入分组和约束旋转时间嵌入则提升了模型对时间信息的理解。

为了培养 OmniVinci 的全模态理解能力,研究团队采用了两阶段的训练方法。首先是模态特定训练,接着进行全模态联合训练,利用隐式和显式学习数据,显著提升了模型的联合理解能力。

随着 OmniVinci 的发布,英伟达再次展示了其在人工智能领域的技术创新,预示着未来 AI 系统将更加智能、灵活。

github:https://github.com/NVlabs/OmniVinci 划重点: 🌟 OmniVinci 模型在全模态理解基准测试中超越了 顶尖 模型19.05分。

📊 训练数据量仅为竞争对手的1/6,数据效率提升至六倍。

🔑 采用创新架构和两阶段训练方法,显著提升模型的多模态理解能力。

(以上内容均由Ai生成)

你可能还想读

特斯拉FSD新版本允许驾驶时看手机

特斯拉FSD新版本允许驾驶时看手机

快速阅读: 据媒体报道,特斯拉CEO马斯克称,FSD v14.2.1版本在特定交通条件下允许驾驶员短暂使用手机;测试显示,在低中流量路段未触发监控提醒,但法律与安全风险仍存。专家强调,驾驶时须遵守法规并保持专注。 12月12日,特斯拉首席执 […]

发布时间:2025年12月16日
特斯拉FSD新版本允许开车时看手机

特斯拉FSD新版本允许开车时看手机

快速阅读: 最新消息显示,特斯拉FSD v14.2.1版本在特定低密度交通环境下允许驾驶员短暂使用手机,但测试表明系统仅在高密度路段发出提醒;专家强调驾驶员仍须专注路况并承担法律责任,多地法规亦禁止驾驶时手持手机。 12月12日,特斯拉首席 […]

发布时间:2025年12月16日
韦氏词典年度词汇嘲讽AI垃圾内容

韦氏词典年度词汇嘲讽AI垃圾内容

快速阅读: 据韦氏词典报道,2025年“AI slop”一词被广泛用于指代低质、冗余的AI生成内容,如虚假新闻和劣质广告图像。该词带有戏谑贬义,强调盲目量产而非提升质量,区别于AI在编程等领域的有效应用。 2025年12月16日,随着人工智 […]

发布时间:2025年12月16日
Tiiny推口袋AI超算,离线运行大模型

Tiiny推口袋AI超算,离线运行大模型

快速阅读: 据Tiiny消息,该公司近日推出AI Pocket Lab微型计算机,可在无网、无独显条件下本地运行百亿至千亿参数大模型,整机功耗低于65瓦,获吉尼斯认证为最小同类设备之一。 美国初创企业Tiiny近日推出AI Pocket L […]

发布时间:2025年12月16日
TikTok推新工具识别AI生成内容

TikTok推新工具识别AI生成内容

快速阅读: 据TikTok消息,平台正部署AI生成内容识别技术,通过嵌入不可见数字水印追踪经剪辑或转发的AI视频,并在界面增设推荐调节滑块,允许用户优化内容偏好,提升透明度与体验,该体系已在部分市场逐步上线。 TikTok正加强技术手段,以 […]

发布时间:2025年12月16日
AI助研团队阻断病毒入侵

AI助研团队阻断病毒入侵

快速阅读: 据业内消息,科研团队在《纳米尺度》期刊发表研究,利用AI与分子模拟发现病毒融合蛋白的关键相互作用,干预后可阻断病毒入侵细胞,为抗病毒药物研发提供新靶点和机制解析。 一项研究于11月发表在《纳米尺度》(Nanoscale)期刊上, […]

发布时间:2025年12月16日
AI智能体上演社交媒体真人秀

AI智能体上演社交媒体真人秀

快速阅读: 截至本周,据开发者哈珀·里德团队实验发现,AI智能体在社交平台自发掌握“暗讽”行为,能针对其他智能体发布隐晦批评,其互动模式高度拟人,引发对AI自主交互伦理与监管机制的广泛关注。 近日,开发者哈珀·里德带领团队开展了一项人工智能 […]

发布时间:2025年12月16日
英伟达收购AI开发商加码开源布局

英伟达收购AI开发商加码开源布局

快速阅读: 据英伟达消息,该公司近日收购开源作业调度系统开发商SchedMD,以强化其在AI软件生态布局。Slurm系统广泛用于大模型训练任务管理,收购后将继续开源分发,并已适配英伟达最新硬件,助力其应对全球竞争。 英伟达近日宣布收购人工智 […]

发布时间:2025年12月16日