创新带来影响:NVIDIA Research 如何推动 AI、图形等领域的变革性工作
快速阅读: 据《NVIDIA 官方博客》最新报道,英伟达研究机构自2006年成立以来,致力于人工智能、图形学等领域的创新,推动了RTX光线追踪、DLSS等技术的发展。团队通过紧密合作,将研究成果转化为实际应用,影响行业发展方向。
英伟达研究机构是许多开创性创新的根基所在,这些创新支撑着人工智能、加速计算、实时光线追踪以及数据无缝连接的数据中心基础技术。该机构成立于2006年,由大约400名来自全球的专家组成,涵盖计算机架构、生成式人工智能、图形和机器人等领域的研究。从2009年起,由斯坦福大学计算机科学系前主席比尔·戴利领导的这一研究机构,成为企业研究组织中独一无二的存在——它旨在应对复杂的技术挑战,同时为企业和社会带来深远影响。
“我们刻意努力进行伟大的研究,同时保持与公司的关联,”首席科学家兼英伟达研究部高级副总裁比尔·戴利说道,“很容易做到其中一个,但很难两者兼顾。”
在本周于加州圣何塞举行的英伟达GTC(开发者大会)上,比尔·戴利分享了研究小组的创新成果,这是人工智能核心领域的顶级开发人员会议。
尽管许多研究机构可能将其使命描述为追求比产品团队更长远的项目,但英伟达的研究人员则寻求那些具有更大“风险范围”的项目——如果成功,将带来巨大的潜在收益。
“我们的使命是为公司做正确的事情。这不是为了建立一座最佳论文奖的奖杯陈列室或著名研究人员的博物馆,”图形研究副总裁兼英伟达首位研究员大卫·卢布克说道,“我们是一个小团队,有幸能从事可能会失败的项目。因此,我们必须不浪费这个机会,并尽最大努力在项目上取得成功,从而产生重大影响。”
作为一个团队进行创新
英伟达的核心价值观之一是“一个团队”——一种深入合作的承诺,帮助研究人员与产品团队及行业利益相关者密切协作,将他们的想法转化为现实世界的影响。
“英伟达的每个人都被激励去弄清楚如何一起工作,因为英伟达所做的加速计算工作需要全栈优化,”英伟达应用深度学习研究副总裁布莱恩·卡塔扎罗说道,“如果你的技术每个部分都孤立存在,每个人都待在自己的孤岛上,那就无法做到这一点。你必须作为一个团队一起工作以实现加速。”
在评估潜在项目时,英伟达的研究人员会考虑这个挑战更适合研究团队还是产品团队,这项工作是否值得在顶级会议上发表,以及它是否对英伟达有明确的潜在好处。如果他们决定推进该项目,他们会与关键利益相关者进行沟通。
“我们是一个小团队,有幸能从事可能会失败的项目。因此,我们必须不浪费这个机会。”大卫·卢布克补充道。
该团队通过论文、技术会议和开源平台如GitHub和Hugging Face分享了许多研究成果。但其重点仍然是行业影响。
“我们认为发表论文是我们所做事情的一个非常重要的副作用,但这不是我们工作的重点,”大卫·卢布克说道。
英伟达研究部的第一个努力集中在光线追踪上,经过十年的持续努力,直接促成了英伟达RTX的推出,重新定义了实时计算机图形。
该组织现在包括专门从事芯片设计、网络、编程系统、大型语言模型、基于物理的模拟、气候科学、人形机器人和自动驾驶汽车的团队,并继续扩展以解决更多研究领域并利用全球专业知识。
改变英伟达——以及整个行业
英伟达研究部不仅为公司一些最知名的产品奠定了基础,其创新还推动并促成了当今的人工智能和加速计算时代。
这一切始于CUDA,一个并行计算软件平台和编程模型,使研究人员能够利用GPU加速进行各种应用。CUDA于2006年发布,使得开发人员可以轻松利用GPU的并行处理能力来加速科学模拟、游戏应用程序和创建人工智能模型。
“开发CUDA是英伟达历史上最具变革性的事件,”大卫·卢布克说道,“这发生在我们正式成立研究小组之前,但发生是因为我们雇佣了顶尖的研究人员并与顶尖架构师合作。”
让光线追踪成为现实
一旦英伟达研究部成立,其成员开始致力于GPU加速的光线追踪,花费数年时间开发算法和硬件使之成为可能。2009年,由已故史蒂文·帕克领导的项目——他是NVIDIA专业图形部门的副总裁,也是实时光线追踪的先驱——在2010年的SIGGRAPH论文中详细介绍了NVIDIA OptiX应用框架,达到了产品阶段。
研究人员的工作扩展了,并与NVIDIA的架构组合作,最终导致了NVIDIA RTX光线追踪技术的发展,包括RT Core,使游戏玩家和专业创作者能够实现实时光线追踪。
2018年发布的NVIDIA RTX也标志着另一个NVIDIA研究创新的推出:NVIDIA DLSS,即深度学习超级采样。使用DLSS,图形管道不再需要绘制视频中的所有像素。相反,它只绘制一部分像素,并提供给AI管道所需的信息,以高分辨率清晰地创建图像。
为几乎所有应用加速人工智能
英伟达在人工智能软件方面的研究贡献始于NVIDIA cuDNN库,该库用于GPU加速的神经网络,最初作为研究项目开发,当时深度学习领域仍处于初期阶段——然后在2014年作为产品发布。
随着深度学习的流行和演变为生成式人工智能,英伟达研究部处于前沿地位——例如NVIDIA StyleGAN,这是一种突破性的视觉生成式人工智能模型,展示了神经网络如何快速生成逼真的图像。
虽然生成对抗网络(GAN)在2014年首次提出,“StyleGAN是第一个能够完全通过照片验证的视觉生成模型,”大卫·卢布克说道,“这是一个里程碑式的时刻。”
NVIDIA StyleGAN
英伟达的研究人员引入了一系列流行的GAN模型,例如AI绘画工具GauGAN,后来发展为NVIDIA Canvas应用程序。随着扩散模型、神经辐射场和高斯点阵的兴起,他们仍在推进视觉生成式人工智能——包括最近的3D模型,如Edify 3D和3DGUT。
NVIDIA GauGAN
在大型语言模型领域,Megatron-LM是一项应用研究计划,使大规模LLMs在基于语言的任务(如内容生成、翻译和对话型人工智能)上的高效训练和推理成为可能。它集成到NVIDIA NeMo平台上,用于开发定制的生成式人工智能,该平台还包含起源于NVIDIA研究的语音识别和语音合成模型。
在芯片设计、网络、量子等领域取得突破
人工智能和图形只是英伟达研究部涉足的一些领域——多个团队在芯片架构、电子设计自动化、编程系统、量子计算等领域取得了突破。
2012年,比尔·戴利向美国能源部提交了一项研究提案,该项目后来成为NVIDIA NVLink和NVSwitch,这是一种高速互连,能够在加速计算系统中实现GPU和CPU处理器之间的快速通信。
NVLink交换机托盘
2013年,电路研究团队发表了关于芯片间链接的工作,引入了一种与互连协同设计的信号系统,能够在裸片之间实现高速、低面积和低功耗的链接。该项目最终成为了NVIDIA Grace CPU和NVIDIA Hopper GPU之间的连接。
2021年,ASIC和VLSI研究小组开发了一种名为VS-Quant的软件-硬件协同设计技术,用于AI加速器,使许多机器学习模型能够在高精度下运行4位权重和4位激活。他们的工作影响了NVIDIA Blackwell架构中FP4精度支持的发展。
在今年的CES展会上推出的NVIDIA Cosmos是由NVIDIA研究部创建的平台,旨在加速下一代机器人和自动驾驶汽车的物理人工智能开发。阅读研究论文并查看AI播客节目Cosmos了解详细信息。
了解更多关于NVIDIA研究部的信息,请访问GTC。
观看英伟达创始人兼首席执行官黄仁勋的主旨演讲:查看有关软件产品信息的声明。
(以上内容均由Ai生成)