NVIDIA 在面向企业的 AI 代理上押下重注
快速阅读: 据《印度分析杂志》最新报道,英伟达在2025 Computex展会上推出一系列AI技术,包括AI工厂设计和AI蓝图,助力企业部署具备推理、对话能力的AI助手。Tokkio和AI-Q蓝图助开发者创建能自然对话的智能头像,“杰西卡”等AI已在金融、医疗等领域应用,视频分析AI也显著提高效率。英伟达还宣布在台投资AI超级计算机,推动AI代理发展。
在2025年Computex展会上,英伟达推出了一系列旨在加速人工智能并将其融入工作场所的技术。新的企业级AI工厂验证设计和扩展的AI蓝图集合,意在协助公司部署具备推理、对话和适应能力的AI数字助手。该公司提到,人工智能队友的概念正在进化,企业将从中获益。无论是在欺诈检测、客户服务还是健康教育领域,AI代理不仅在数据上进行训练,还在同理心、上下文和记忆方面接受训练。对于那些专注于生成式AI、数据集成和基础设施规模的企业而言,英伟达的新发布似乎提供了全面的解决方案。不过,这一次的重点更为具体:将AI代理转化为有意义的存在。英伟达还宣布将在台湾投资一台AI超级计算机。
### 不仅仅是工具的人工智能队友
新推出的Tokkio和AI-Q的AI蓝图旨在帮助开发者构建能够自然对话、与企业数据集成,并适应情感或情境变化的智能数字头像。例如,在东京原宿区的COACH商店,购物者现在可以与“imma”聊天,这是由Tokkio和NVIDIA ACE驱动的虚拟造型师。它处理的是即兴对话和实时交流,而非预录脚本。对于一个以个人风格为基础的品牌来说,能够实时个性化推荐不仅是创新之举,更是对客户服务的一种重新定义。
与此同时,像加拿大皇家银行这样的金融机构正在部署内部面向的AI“杰西卡”,帮助员工处理欺诈案件。杰西卡检索最新的欺诈趋势更新和文档,加快决策速度并提升决策质量。在台北(台湾)和辛辛那提(美国)的医院里,AI代理为儿科患者和访客服务。从提供方向到用儿童友好的方式解释治疗方案,这些头像减轻了患者的认知负担,也缓解了过度劳累的工作人员的压力。考虑到许多用户将ChatGPT视为他们的医生,这并不令人意外。
这些并非孤立的试验。它们展示了代理型AI的初步形态,其中软件是互动的、合作的和预测性的。
### 视频分析AI代理的新时代
随着视频如今占据了全球数据流量的一半以上,但不到1%的数据被分析,英伟达还推出了一个新的蓝图,帮助企业利用这一尚未充分利用的资源。基于英伟达Metropolis平台的视频搜索和摘要(VSS)AI蓝图,使企业能够开发出能够理解和总结大量视频内容的视觉AI代理。这些由视觉语言模型(VLMs)和大型语言模型(LLMs)驱动的代理,可以进行实时分析、生成摘要,甚至叙述复杂事件。从监控制造车间到管理城市基础设施,VSS蓝图已被Pegatron等公司和高雄的智慧城市运营商采用。结果包括缺陷率降低67%,事故响应时间缩短至多80%。就连NHL也参与进来——利用AI代理实时标注、总结和检索比赛录像。
### 与企业复杂性同步扩展的人工智能工厂
构建这些代理是一项全栈式的幕后工作。英伟达的企业级AI工厂验证设计提供了一个在现代加速基础设施上部署代理型AI的蓝图。它专为在RTX PRO 6000服务器版GPU、NeMo检索器、微服务及合作伙伴集成环境中运行而设计——本质上是对话式、知识型代理的即插即用后端。
与此同时,人工智能数据平台参考设计将计算更靠近存储。这对于必须搜索数百万份内部文件并在实时做出回应的人工智能代理来说至关重要。IBM、VAST Data和NetApp等公司正将其GPU和NeMo检索器集成到存储解决方案中,使AI能够在数据层直接推理。这种基础设施已经开始大规模生产。
台湾的原始设计制造商(ODM),如富士康、超微、华硕和纬创,正在生产兼容人工智能数据平台的系统,涵盖从英伟达BlueField DPU到Spectrum-X以太网的完整英伟达技术栈。简而言之,英伟达的生态系统现在涵盖了蓝图、硅片、软件和部署合作伙伴。借助来自红帽、Nutanix和Canonical的编排工具,以及来自Galileo和DataRobot等平台的数据工具,企业可以轻松地使用英伟达的技术和AI代理。
(以上内容均由Ai生成)