AI 代理承诺大事。我们如何支持他们?

发布时间:2025年5月7日    来源:szf
AI 代理承诺大事。我们如何支持他们?

快速阅读: 据《The Register》称,Nutanix推出企业级人工智能平台,简化大型语言模型和代理型AI的部署与管理,帮助企业有效控制成本并提升效率。平台与NVIDIA紧密集成,提供一站式解决方案,助力企业在多云及混合云环境下轻松构建AI代理。未来,代理型AI将发展为专注于特定任务的“数字小精灵”,Nutanix预计将迎来广阔前景。

如果有人觉得让ChatGPT根据冰箱里的食材创造食谱很酷,那么请稍等片刻——接下来即将推出的东西会让那显得相当过时。这是人工智能支持者们的期望,他们相信下一代的重要技术将是代理型人工智能。这是一种人工智能的进化形式,使其能够执行更为复杂和强大的任务,从而让市场充满期待。超过五分之四的公司向IDC表示,人工智能代理将成为新的企业应用,他们正重新审视围绕这项新技术的软件采购策略。

所有这些都需要大量人工智能模型同时运行才能表现良好,而且都需要妥善管理。这就是Nutanix提供的AI就绪基础设施所要解决的问题。

那么什么是代理型人工智能呢?早期的大规模语言模型(LLMs)专注于执行人类过去只能完成的基本任务。文本转录、食谱推荐和电子表格格式化等功能都很实用,但LLMs缺乏深度,难以连续完成多项任务以达成更复杂的成果。这就是代理型人工智能——建立在推理模型基础上的地方。

推理模型不仅能检索和重新混合信息,还能通过多步骤问题逐步解决问题。它们通常能对新情况应用逻辑,而非已知情况。这使得它们能够表现出我们所说的代理行为。

代理型模型并非简单工具,而是在追求更复杂目标的过程中设定子目标,同时在过程中反思输出以确保准确性,并实时调整以适应上下文。它们也可能使用诸如软件应用程序或在线服务之类的工具来帮助实现目标。

假设你想分析机翼的流体动力学并提出一些替代设计以提高燃油效率。如果你想让某人可靠地为你处理基础工作,你可以让一位博士生负责,无需担心细节。一个代理型人工智能相当于这一角色。

Nutanix首席人工智能官德布·杜塔表示,代理型人工智能会借助多个LLMs进行反思。“这些大规模语言模型利用传统数据库、存储以及一些较新的组件,如向量数据库。”他补充道。

推理型LLMs的力量,结合这些底层基础设施工具,为企业自动化带来了新的活力。他指出:“现在,大规模语言模型能够做出更好的决策和更好的规划。”例如,从评估客户投诉并建议最佳行动方案。他观察到,“它们在许多传统软件难以实现的任务上表现得相当出色。”

模型的激增

构建和部署代理型人工智能需要大量资源,尤其当其复杂度提升时。

每个代理型应用程序通常会同时使用多个专门针对特定角色定制的模型,而非单一通用模型。

这些包括用于基本决策和推理任务的一般思维与推断、数据嵌入(将现有数据转换为LLMs可理解的格式)以及结果重排序。后者在代理型工作流程中用于优先级排序和确定搜索结果的相关性。代理型系统还需配备模型守卫,以避免模型生成冒犯性或不适当的内容。

杜塔区分了驱动人工智能的LLMs与端点。后者是应用程序将调用的API,以利用模型的功能。

随着这些模型数量的激增,部署和使用它们的过程变得更加复杂。杜塔指出,这还由于运行这些计算密集型模型的成本较高。云服务提供商按每令牌计费,无节制的使用会导致成本快速上升。

Nutanix提供了什么

Nutanix专注于开发高效部署客户本地、云和多云环境以及混合场景下云技术的软件。该公司提供Nutanix企业人工智能,这是一个统一平台,旨在简化、保障并扩展大型语言模型(LLMs)和代理型工作流在私有、公有及混合云环境中的部署。

Nutanix企业人工智能是该公司历程的最新一步,旨在使客户的负载在整个基础设施(从边缘到核心再到云)中更易于管理和迁移。

Nutanix专注于开发高效部署客户本地、云和多云环境以及混合场景下云技术的软件。该公司提供Nutanix企业人工智能,这是一个统一平台,旨在简化、保障并扩展大型语言模型(LLMs)和代理型工作流在私有、公有及混合云环境中的部署。

“企业确实需要能提供‘一键式’解决方案的供应商和方案,”他说,回想起2000年代中期Staples的著名营销活动。Nutanix在超融合基础设施硬件领域起步,并在专注云基础设施软件后多年一直致力于此。

转向人工智能,尤其是生成式人工智能,提升了那些常面临波动性和高成本工作负载的公司的门槛。在云端部署LLMs相对容易,但需要为此付出代价,特别是在所有开发人员同时开始这么做时。而在自己的场所部署这些对计算能力和网络连接要求较高的资产则更加困难,杜塔警告说。你该如何相应地配置硬件?如何进行容量规划和成本分析?“那么,如何才能获得那个‘一键部署’的功能,用于部署我的大型语言模型以及构建AI代理所需的其他一切呢?”他说。随着我们从简单的聊天机器人发展到基于RAG的LLM与私有公司数据交互,再到由多个模型组成的更复杂的代理模型,这种需求变得更加迫切。这就是Nutanix企业AI发挥作用的地方,杜塔解释道。它是一个单一的控制点,可以运行公司的所有LLM和代理端点,具备三大目标:简化性、全面控制和可预测的成本。Nutanix企业AI现在是GPT-in-a-Box 2.0解决方案的一部分,这是Nutanix的全栈解决方案,用于快速生成式AI部署。在客户在GPT-in-a-Box 2.0中设置好预验证的生成式AI工具和用例后,企业AI部分提供了LLM的第二天操作和管理能力。简化即力量这种简化性体现在产品的集中式架构中。它允许管理员从NVIDIA推理微服务(NIM)和Hugging Face部署LLM,并且可以选择上传自己的自定义模型,甚至是在离线环境中。他们可以从一个单一的控制点安装和管理这些模型,无论是利用Nutanix Kubernetes平台在裸机硬件上本地部署,还是在Google、Amazon和Microsoft等云中的CNCF认证Kubernetes环境中运行。

将管理员置于对这些计算密集型资源的掌控之中

Nutanix企业AI的全面控制和成本管理方面是相互关联的。部署后,管理员可以使用Nutanix企业AI为每个开发人员生成安全访问API令牌。开发人员不是直接访问模型,而是通过这些API令牌访问端点,这些端点是运行在GPU支持的基础架构上的模型实例,并通过安全的API暴露出来。管理员可以为开发人员授予基于角色的端点访问权限。这与传统且不够成熟的开发模式不同,在传统模式中,开发人员可以自主设置自己的模型——这种方法有望带来显著的成本效益提升。“对于任何应用程序,平均而言你会看到大约四到五个LLM,”杜塔说。“现在想象一下我们100个人都试图设置这些模型。企业IT部门需应对安全性、额外的管理负担以及不断攀升的成本。”将管理员置于对这些计算密集型资源的掌控之中,从而更有效地管控模型使用并管理成本。“我们已经看到客户非常欣赏企业IT拥有统一控制层这一事实,”杜塔解释说。

Nutanix与NVIDIA的合作

作为一个供应商中立的解决方案,Nutanix可以在各种硬件上工作,但这并没有阻止它与特定硬件合作伙伴建立更紧密的集成关系。这自然包括房间里的大猩猩:NVIDIA。Nutanix支持NVIDIA在其裸机和Kubernetes部署中运行。

Nutanix企业AI与NVIDIA NIM集成,用于部署和操作生成式AI模型。Nutanix软件让在需要的地方——无论是数据中心还是公共云中——部署NIM更加容易。Nutanix软件还支持NVIDIA的Dynamo产品,这是一个具有缓存功能的分布式推理引擎。

“这些都是令人惊叹的乐高积木。但如果100个人都在做同样的事情,就会导致混乱,”杜塔说。通过Nutanix企业AI进行管理,能让客户更好地掌控。

Nutanix支持NVIDIA在其裸机和Kubernetes部署中运行。Nutanix企业AI与NVIDIA NIM集成,用于部署和操作生成式AI模型。Nutanix软件让在需要的地方——无论是数据中心还是公共云中——部署NIM更加容易。

与NVIDIA合作使Nutanix能够对其硬件合作伙伴的服务器和GPU等设备上的NIM进行验证和认证。这确保NIM能在Nutanix客户选择运行的任何地方正常运行。

Nutanix支持NVIDIA在其裸机和Kubernetes部署中运行。Nutanix企业AI与NVIDIA NIM集成,用于部署和操作生成式AI模型。Nutanix软件让在需要的地方——无论是数据中心还是公共云中——部署NIM更加容易。

Nutanix还针对NVIDIA自己的AI Enterprise软件堆栈对其Enterprise AI软件进行了认证,包括NVIDIA为常见场景提供的蓝图及其完整的推理引擎套件。

Nutanix支持NVIDIA在其裸机和Kubernetes部署中运行。Nutanix企业AI与NVIDIA NIM集成,用于部署和操作生成式AI模型。Nutanix软件让在需要的地方——无论是数据中心还是公共云中——部署NIM更加容易。

代理AI的未来

杜塔表示,这只是代理AI的开始,他预见其将以快速的步伐发展。随着推理模型的能力增强,它们将开启新的可能性,他说。“当这种分析思维过程应用于AI代理时,创建数字小精灵已指日可待,”他说。他对成为现实世界中的格鲁(当然没有邪恶的部分)感到非常高兴,指挥着他在数字劳动力中的数百个可爱的小代理角色。

杜塔警告说,单个小精灵不会擅长所有事情:“从计算和能源的角度来看,创造一个全能的小精灵是非常困难且昂贵的。”相反,他预见每个代理小精灵将在相对狭窄的任务上表现出色。也许这里有一个负责预约的小精灵,那里有一个擅长总结票务历史的小精灵。或许还有一个擅长多源检索和研究排名的小精灵。

随着这些代理系统——本质上是强化版的AI驱动微服务——逐渐普及,公司需要有能力管理它们所创建的计算密集型服务网络。因此,杜塔认为Nutanix有一个光明的未来,因为它助力客户更高效地管理这些服务,以供使用的开发人员使用。

由Nutanix赞助

(以上内容均由Ai生成)

你可能还想读

本周科技大事件:谷歌发布Pixel 10,Gamescom揭晓重磅游戏

本周科技大事件:谷歌发布Pixel 10,Gamescom揭晓重磅游戏

快速阅读: 谷歌推出Pixel 10手机及Pixel Watch 4,新增卫星紧急通讯、可更换电池和屏幕、抬手通话等功能,屏幕亮度达3000尼特,还将与斯蒂芬·库里合作推出AI健康和健身教练服务。 谷歌本周在“由谷歌制造”活动中推出了Pix […]

发布时间:2025年8月23日
SK海力士凭借HBM激增首次超越三星,领跑全球内存市场

SK海力士凭借HBM激增首次超越三星,领跑全球内存市场

快速阅读: 据《《韩国先驱报》》称,7月20日,SK海力士首登全球内存芯片市场榜首,受益于AI产品和HBM芯片领先地位。其季度利润达9.2万亿韩元,远超三星。 据韩联社报道,7月20日,韩国京畿道伊川,SK海力士首次登上全球内存芯片市场榜首 […]

发布时间:2025年8月1日
STAN 从谷歌、万代南梦宫和其他公司筹集了 850 万美元

STAN 从谷歌、万代南梦宫和其他公司筹集了 850 万美元

快速阅读: 据《印度教业务线》称,STAN获850万美元融资,由万代南梦宫等机构投资。计划拓展印度市场,加强AI功能与创作者工具。平台用户超2500万,专注移动端社交游戏。 记者获悉,8月1日,社交游戏平台STAN宣布完成850万美元的新一 […]

发布时间:2025年8月1日
“这改变了一切”:谷歌的人工智能模式迫使品牌重新考虑搜索策略

“这改变了一切”:谷歌的人工智能模式迫使品牌重新考虑搜索策略

快速阅读: 据《营销周》称,谷歌推出AI搜索模式,减少外部链接,提升对话式回答。品牌需调整策略,重视内容质量与品牌权威。此变化影响营销方式,竞争加剧。 据谷歌官方消息,7月29日,谷歌在英国推出了基于人工智能的搜索功能AI模式,此前该功能已 […]

发布时间:2025年8月1日
在 Android 上用更智能的应用程序替换 Google Assistant

在 Android 上用更智能的应用程序替换 Google Assistant

快速阅读: 据《电话竞技场》称,据报道,用户可从Google Play下载Meta AI应用,安装后需检查版本是否为230.0.0.36.164或更高。操作方法:进入设置,选择应用,查看Meta AI信息页底部的版本号。 据媒体报道,用户现 […]

发布时间:2025年8月1日
Xero 的英国董事总经理回击人工智能正在抢走会计工作的说法

Xero 的英国董事总经理回击人工智能正在抢走会计工作的说法

快速阅读: 据《UKTN(英国科技新闻)》称,英国科技媒体UKTN报道,Xero英国总经理凯特·海沃德表示,会计行业无需过度担忧AI自动化。尽管四大事务所裁员,但Xero仍持续投资AI技术,提升效率与服务质量。 据英国科技新闻网站UKTN报 […]

发布时间:2025年8月1日
Reddit 计划在搜索引擎市场大力推动人工智能与谷歌竞争:报告

Reddit 计划在搜索引擎市场大力推动人工智能与谷歌竞争:报告

快速阅读: 据《商业标准》称,Reddit CEO表示,公司正将平台转型为搜索引擎,整合AI功能,提升用户体验。Reddit Answers用户已超600万,计划全球推广。 据《The Verge》报道,7月11日,Reddit首席执行官史 […]

发布时间:2025年8月1日
Meta 超出预期,为“个人超级智能”做准备

Meta 超出预期,为“个人超级智能”做准备

快速阅读: 据《RCR无线》称,Meta二季度营收475.2亿美元,净利润183亿美元。CEO扎克伯格称将打造个人超级智能,但数据中心扩容遇挑战。公司计划2025年支出达1140-1180亿美元。 据媒体报道,7月25日,美国加州,社交媒体 […]

发布时间:2025年8月1日