Nvidia 发布 NeMo 微服务以简化 AI 代理开发

发布时间:2025年4月25日    来源:szf
Nvidia 发布 NeMo 微服务以简化 AI 代理开发

快速阅读: 据《福布斯》最新报道,英伟达推出Nemo微服务通用版,帮助企业构建与业务系统集成并持续改进的AI代理工具。该工具包包含五大微服务,支持多种AI模型。相比竞争对手,它通过与硬件生态整合及企业级支持脱颖而出。这对技术团队简化AI实施、保持数据准确性至关重要,标志着企业AI工具成熟度提升。

英伟达发布Nemo微服务通用版本
为企业提供构建与业务系统集成且通过数据交互持续改进的AI代理工具

企业AI正面临数据集成难题:构建能够从商业数据中不断学习以保持准确性和实用性的系统。Nemo微服务通过创建英伟达所描述的“数据飞轮”,使AI系统通过持续接触企业信息和用户互动保持相关性,从而解决这一问题。

新发布的工具包包含五个关键微服务:

**Nemo定制器**
处理大型语言模型微调,具有更高的训练吞吐量。

**Nemo评估器**
提供简化评估AI模型的自定义基准。

**Nemo护栏**
实施安全控制以确保合规性和适当响应。

**Nemo检索器**
在企业系统间实现信息访问。

**Nemo策展人**
处理并组织数据用于模型训练和改进。

这些组件协同工作以构建AI代理,作为数字队友,能够在较少人类监督下执行任务。与普通聊天机器人不同,这些代理可根据企业数据自主行动并做出决策。它们连接到现有系统以获取组织边界内的当前信息。

技术支持持续优化
Nemo与英伟达推理微服务(简称NIMs)的区别在于它们的功能互补。据英伟达企业生成式AI软件高级总监乔伊·康威所说:“NIMs用于推理部署——运行模型、输入问题、输出答案。Nemo专注于如何改进该模型:数据准备、训练技术、评估。”当Nemo完成模型优化后,可通过NIM进行生产部署。

早期实施展现了实际的商业价值。通信软件提供商爱德科斯利用Nemo微服务开发了三个专用代理。AT&T与Arize和Quantiphi合作构建了一个每周处理约1万份文档更新的代理。思科的Outshift部门与伽利略合作创建了一个编码助手,比同类工具更快响应。

这些微服务以Docker容器形式运行,并通过Kubernetes编排,可在各种计算环境中部署。它们支持包括Meta的Llama、微软的Phi系列、谷歌的Gemini和Mistral在内的多种AI模型。英伟达自家专注于推理能力的Llama Nemotron Ultra也与此系统兼容。

此次发布进入了竞争激烈的市场,企业有众多AI开发选项。替代方案包括亚马逊的Bedrock、微软的Azure AI Foundry、谷歌的Vertex AI等。英伟达通过与自身硬件生态系统的整合以及通过AI Enterprise软件平台提供企业级支持来区别于其他产品。

Nemo微服务与企业AI采用
对于技术团队而言,这些微服务提供了降低实施复杂性的基础设施。容器化方式可在本地或云环境中部署,并具有企业安全和稳定性功能。这种灵活性解决了AI实施中常见的数据主权和监管合规问题。

评估这些工具的组织应考虑其现有的GPU基础设施投入、数据治理需求以及与现有系统的集成需求。需要保持对变化商业数据准确性要求的AI代理将推动对支持持续学习周期的平台的需求。

微服务方法体现了行业向模块化AI系统的更广泛转型,这些系统可在不重建基本组件的情况下针对特定业务领域进行定制。对于技术决策者来说,这次发布代表了企业AI工具成熟度的又一步骤,缩小了研究能力与实际业务应用之间的差距。

随着企业超越实验阶段迈向生产AI系统,简化构建持续改进模型的工具变得越来越有价值。“数据飞轮”概念体现了一种架构模式,其中AI系统通过持续接触组织信息保持与业务需求的对齐。微服务方法体现了行业向模块化AI系统的更广泛转型,这些系统可在不重建基本组件的情况下针对特定业务领域进行定制。对于技术决策者来说,这次发布代表了企业AI工具成熟度的又一步骤,缩小了研究能力与实际业务应用之间的差距。

(以上内容均由Ai生成)

你可能还想读

美国能源部 17 个国家实验室全景及创世纪计划战略布局分析

美国能源部 17 个国家实验室全景及创世纪计划战略布局分析

快速阅读: 美国能源部17个国家实验室构成顶尖科研体系,在基础科学、能源安全、气候变化等领域发挥关键作用。拥有全球领先的超算资源及顶尖人才,年经费约220亿美元。随着“创世纪计划”启动,实验室将形成协同网络,推动美国在清洁能源、量子计算等前 […]

发布时间:2025年12月8日
谷歌Gemini 3 Pro发布

谷歌Gemini 3 Pro发布

快速阅读: 谷歌发布新一代推理模型Gemini 3 Pro,显著提升数学、编程和视觉理解能力。一经发布,Gemini 3 Pro几乎横扫各大评测榜单,在LMArena大模型竞技场中以1501的Elo得分高居榜首。在MathArena数学竞赛 […]

发布时间:2025年11月19日
独具创新,直击痛点:深度解析华为十大最新方案

独具创新,直击痛点:深度解析华为十大最新方案

快速阅读: 第三个方案,是华为的U6GHzAAU天线。综合来看,华为的U6GAAU,真正实现了容量覆盖双优,助力全球U6G商用。LampSiteX,是LampSite系列的最新型号。第五个方案,是华为有源天线产品——EasyAAU。Easy […]

发布时间:2025年11月13日
Palantir估值承压仍领跑AI赛道

Palantir估值承压仍领跑AI赛道

快速阅读: 近期,美国AI概念股整体承压,Palantir与英伟达遭遇做空传闻,引发市场短暂震荡。然而,在宏观调整与估值质疑中,Palantir仍凭借强劲业绩与差异化AI布局维持长期增长势头。分析人士认为,该公司正处于由“政府数据支撑”向“ […]

发布时间:2025年11月12日
Palantir与Snowflakes深化AI合作

Palantir与Snowflakes深化AI合作

快速阅读: Snowflake 与 Palantir 宣布建立战略合作,整合双方的数据与AI能力,使企业能够在统一的数据基础上直接调用 Palantir 的AI分析与智能应用工具,加速企业级AI落地。 2025年10月,Snowflake […]

发布时间:2025年11月10日
Palantir与迪拜控股共建AI公司

Palantir与迪拜控股共建AI公司

快速阅读: Dubai Holding 与 Palantir 宣布成立合资公司 Aither,致力于为中东地区政府与企业提供人工智能转型解决方案。该合作标志着 Palantir 在中东技术布局的进一步深化,也为当地公共服务与产业数字化提供新 […]

发布时间:2025年11月10日
Palantir携手Lumen共建企业AI平台

Palantir携手Lumen共建企业AI平台

快速阅读: 2025年10月,Palantir Technologies与Lumen Technologies宣布达成战略合作,联合打造面向企业级应用的人工智能服务平台。双方将以Palantir的Foundry与AIP平台为核心,推动通信与 […]

发布时间:2025年11月7日
Palantir携手Hadean拓展英国国防部AI战场模拟平台

Palantir携手Hadean拓展英国国防部AI战场模拟平台

快速阅读: 2025年10月,数据智能公司 Palantir Technologies 宣布与英国分布式计算企业 Hadean 达成战略合作,双方将共同为英国国防部(UK Ministry of Defence, UK MoD)扩展基于人工 […]

发布时间:2025年11月7日