Nvidia 发布 NeMo 微服务以简化 AI 代理开发

发布时间:2025年4月25日    来源:szf
Nvidia 发布 NeMo 微服务以简化 AI 代理开发

快速阅读: 据《福布斯》最新报道,英伟达推出Nemo微服务通用版,帮助企业构建与业务系统集成并持续改进的AI代理工具。该工具包包含五大微服务,支持多种AI模型。相比竞争对手,它通过与硬件生态整合及企业级支持脱颖而出。这对技术团队简化AI实施、保持数据准确性至关重要,标志着企业AI工具成熟度提升。

英伟达发布Nemo微服务通用版本
为企业提供构建与业务系统集成且通过数据交互持续改进的AI代理工具

企业AI正面临数据集成难题:构建能够从商业数据中不断学习以保持准确性和实用性的系统。Nemo微服务通过创建英伟达所描述的“数据飞轮”,使AI系统通过持续接触企业信息和用户互动保持相关性,从而解决这一问题。

新发布的工具包包含五个关键微服务:

**Nemo定制器**
处理大型语言模型微调,具有更高的训练吞吐量。

**Nemo评估器**
提供简化评估AI模型的自定义基准。

**Nemo护栏**
实施安全控制以确保合规性和适当响应。

**Nemo检索器**
在企业系统间实现信息访问。

**Nemo策展人**
处理并组织数据用于模型训练和改进。

这些组件协同工作以构建AI代理,作为数字队友,能够在较少人类监督下执行任务。与普通聊天机器人不同,这些代理可根据企业数据自主行动并做出决策。它们连接到现有系统以获取组织边界内的当前信息。

技术支持持续优化
Nemo与英伟达推理微服务(简称NIMs)的区别在于它们的功能互补。据英伟达企业生成式AI软件高级总监乔伊·康威所说:“NIMs用于推理部署——运行模型、输入问题、输出答案。Nemo专注于如何改进该模型:数据准备、训练技术、评估。”当Nemo完成模型优化后,可通过NIM进行生产部署。

早期实施展现了实际的商业价值。通信软件提供商爱德科斯利用Nemo微服务开发了三个专用代理。AT&T与Arize和Quantiphi合作构建了一个每周处理约1万份文档更新的代理。思科的Outshift部门与伽利略合作创建了一个编码助手,比同类工具更快响应。

这些微服务以Docker容器形式运行,并通过Kubernetes编排,可在各种计算环境中部署。它们支持包括Meta的Llama、微软的Phi系列、谷歌的Gemini和Mistral在内的多种AI模型。英伟达自家专注于推理能力的Llama Nemotron Ultra也与此系统兼容。

此次发布进入了竞争激烈的市场,企业有众多AI开发选项。替代方案包括亚马逊的Bedrock、微软的Azure AI Foundry、谷歌的Vertex AI等。英伟达通过与自身硬件生态系统的整合以及通过AI Enterprise软件平台提供企业级支持来区别于其他产品。

Nemo微服务与企业AI采用
对于技术团队而言,这些微服务提供了降低实施复杂性的基础设施。容器化方式可在本地或云环境中部署,并具有企业安全和稳定性功能。这种灵活性解决了AI实施中常见的数据主权和监管合规问题。

评估这些工具的组织应考虑其现有的GPU基础设施投入、数据治理需求以及与现有系统的集成需求。需要保持对变化商业数据准确性要求的AI代理将推动对支持持续学习周期的平台的需求。

微服务方法体现了行业向模块化AI系统的更广泛转型,这些系统可在不重建基本组件的情况下针对特定业务领域进行定制。对于技术决策者来说,这次发布代表了企业AI工具成熟度的又一步骤,缩小了研究能力与实际业务应用之间的差距。

随着企业超越实验阶段迈向生产AI系统,简化构建持续改进模型的工具变得越来越有价值。“数据飞轮”概念体现了一种架构模式,其中AI系统通过持续接触组织信息保持与业务需求的对齐。微服务方法体现了行业向模块化AI系统的更广泛转型,这些系统可在不重建基本组件的情况下针对特定业务领域进行定制。对于技术决策者来说,这次发布代表了企业AI工具成熟度的又一步骤,缩小了研究能力与实际业务应用之间的差距。

(以上内容均由Ai生成)

你可能还想读

本周科技大事件:谷歌发布Pixel 10,Gamescom揭晓重磅游戏

本周科技大事件:谷歌发布Pixel 10,Gamescom揭晓重磅游戏

快速阅读: 谷歌推出Pixel 10手机及Pixel Watch 4,新增卫星紧急通讯、可更换电池和屏幕、抬手通话等功能,屏幕亮度达3000尼特,还将与斯蒂芬·库里合作推出AI健康和健身教练服务。 谷歌本周在“由谷歌制造”活动中推出了Pix […]

发布时间:2025年8月23日
SK海力士凭借HBM激增首次超越三星,领跑全球内存市场

SK海力士凭借HBM激增首次超越三星,领跑全球内存市场

快速阅读: 据《《韩国先驱报》》称,7月20日,SK海力士首登全球内存芯片市场榜首,受益于AI产品和HBM芯片领先地位。其季度利润达9.2万亿韩元,远超三星。 据韩联社报道,7月20日,韩国京畿道伊川,SK海力士首次登上全球内存芯片市场榜首 […]

发布时间:2025年8月1日
STAN 从谷歌、万代南梦宫和其他公司筹集了 850 万美元

STAN 从谷歌、万代南梦宫和其他公司筹集了 850 万美元

快速阅读: 据《印度教业务线》称,STAN获850万美元融资,由万代南梦宫等机构投资。计划拓展印度市场,加强AI功能与创作者工具。平台用户超2500万,专注移动端社交游戏。 记者获悉,8月1日,社交游戏平台STAN宣布完成850万美元的新一 […]

发布时间:2025年8月1日
“这改变了一切”:谷歌的人工智能模式迫使品牌重新考虑搜索策略

“这改变了一切”:谷歌的人工智能模式迫使品牌重新考虑搜索策略

快速阅读: 据《营销周》称,谷歌推出AI搜索模式,减少外部链接,提升对话式回答。品牌需调整策略,重视内容质量与品牌权威。此变化影响营销方式,竞争加剧。 据谷歌官方消息,7月29日,谷歌在英国推出了基于人工智能的搜索功能AI模式,此前该功能已 […]

发布时间:2025年8月1日
在 Android 上用更智能的应用程序替换 Google Assistant

在 Android 上用更智能的应用程序替换 Google Assistant

快速阅读: 据《电话竞技场》称,据报道,用户可从Google Play下载Meta AI应用,安装后需检查版本是否为230.0.0.36.164或更高。操作方法:进入设置,选择应用,查看Meta AI信息页底部的版本号。 据媒体报道,用户现 […]

发布时间:2025年8月1日
Xero 的英国董事总经理回击人工智能正在抢走会计工作的说法

Xero 的英国董事总经理回击人工智能正在抢走会计工作的说法

快速阅读: 据《UKTN(英国科技新闻)》称,英国科技媒体UKTN报道,Xero英国总经理凯特·海沃德表示,会计行业无需过度担忧AI自动化。尽管四大事务所裁员,但Xero仍持续投资AI技术,提升效率与服务质量。 据英国科技新闻网站UKTN报 […]

发布时间:2025年8月1日
Reddit 计划在搜索引擎市场大力推动人工智能与谷歌竞争:报告

Reddit 计划在搜索引擎市场大力推动人工智能与谷歌竞争:报告

快速阅读: 据《商业标准》称,Reddit CEO表示,公司正将平台转型为搜索引擎,整合AI功能,提升用户体验。Reddit Answers用户已超600万,计划全球推广。 据《The Verge》报道,7月11日,Reddit首席执行官史 […]

发布时间:2025年8月1日
Meta 超出预期,为“个人超级智能”做准备

Meta 超出预期,为“个人超级智能”做准备

快速阅读: 据《RCR无线》称,Meta二季度营收475.2亿美元,净利润183亿美元。CEO扎克伯格称将打造个人超级智能,但数据中心扩容遇挑战。公司计划2025年支出达1140-1180亿美元。 据媒体报道,7月25日,美国加州,社交媒体 […]

发布时间:2025年8月1日