AI 代理承诺大事。我们如何支持他们?
快速阅读: 据《The Register》称,Nutanix推出企业级人工智能平台,简化大型语言模型和代理型AI的部署与管理,帮助企业有效控制成本并提升效率。平台与NVIDIA紧密集成,提供一站式解决方案,助力企业在多云及混合云环境下轻松构建AI代理。未来,代理型AI将发展为专注于特定任务的“数字小精灵”,Nutanix预计将迎来广阔前景。
如果有人觉得让ChatGPT根据冰箱里的食材创造食谱很酷,那么请稍等片刻——接下来即将推出的东西会让那显得相当过时。这是人工智能支持者们的期望,他们相信下一代的重要技术将是代理型人工智能。这是一种人工智能的进化形式,使其能够执行更为复杂和强大的任务,从而让市场充满期待。超过五分之四的公司向IDC表示,人工智能代理将成为新的企业应用,他们正重新审视围绕这项新技术的软件采购策略。
所有这些都需要大量人工智能模型同时运行才能表现良好,而且都需要妥善管理。这就是Nutanix提供的AI就绪基础设施所要解决的问题。
那么什么是代理型人工智能呢?早期的大规模语言模型(LLMs)专注于执行人类过去只能完成的基本任务。文本转录、食谱推荐和电子表格格式化等功能都很实用,但LLMs缺乏深度,难以连续完成多项任务以达成更复杂的成果。这就是代理型人工智能——建立在推理模型基础上的地方。
推理模型不仅能检索和重新混合信息,还能通过多步骤问题逐步解决问题。它们通常能对新情况应用逻辑,而非已知情况。这使得它们能够表现出我们所说的代理行为。
代理型模型并非简单工具,而是在追求更复杂目标的过程中设定子目标,同时在过程中反思输出以确保准确性,并实时调整以适应上下文。它们也可能使用诸如软件应用程序或在线服务之类的工具来帮助实现目标。
假设你想分析机翼的流体动力学并提出一些替代设计以提高燃油效率。如果你想让某人可靠地为你处理基础工作,你可以让一位博士生负责,无需担心细节。一个代理型人工智能相当于这一角色。
Nutanix首席人工智能官德布·杜塔表示,代理型人工智能会借助多个LLMs进行反思。“这些大规模语言模型利用传统数据库、存储以及一些较新的组件,如向量数据库。”他补充道。
推理型LLMs的力量,结合这些底层基础设施工具,为企业自动化带来了新的活力。他指出:“现在,大规模语言模型能够做出更好的决策和更好的规划。”例如,从评估客户投诉并建议最佳行动方案。他观察到,“它们在许多传统软件难以实现的任务上表现得相当出色。”
模型的激增
构建和部署代理型人工智能需要大量资源,尤其当其复杂度提升时。
每个代理型应用程序通常会同时使用多个专门针对特定角色定制的模型,而非单一通用模型。
这些包括用于基本决策和推理任务的一般思维与推断、数据嵌入(将现有数据转换为LLMs可理解的格式)以及结果重排序。后者在代理型工作流程中用于优先级排序和确定搜索结果的相关性。代理型系统还需配备模型守卫,以避免模型生成冒犯性或不适当的内容。
杜塔区分了驱动人工智能的LLMs与端点。后者是应用程序将调用的API,以利用模型的功能。
随着这些模型数量的激增,部署和使用它们的过程变得更加复杂。杜塔指出,这还由于运行这些计算密集型模型的成本较高。云服务提供商按每令牌计费,无节制的使用会导致成本快速上升。
Nutanix提供了什么
Nutanix专注于开发高效部署客户本地、云和多云环境以及混合场景下云技术的软件。该公司提供Nutanix企业人工智能,这是一个统一平台,旨在简化、保障并扩展大型语言模型(LLMs)和代理型工作流在私有、公有及混合云环境中的部署。
Nutanix企业人工智能是该公司历程的最新一步,旨在使客户的负载在整个基础设施(从边缘到核心再到云)中更易于管理和迁移。
Nutanix专注于开发高效部署客户本地、云和多云环境以及混合场景下云技术的软件。该公司提供Nutanix企业人工智能,这是一个统一平台,旨在简化、保障并扩展大型语言模型(LLMs)和代理型工作流在私有、公有及混合云环境中的部署。
“企业确实需要能提供‘一键式’解决方案的供应商和方案,”他说,回想起2000年代中期Staples的著名营销活动。Nutanix在超融合基础设施硬件领域起步,并在专注云基础设施软件后多年一直致力于此。
转向人工智能,尤其是生成式人工智能,提升了那些常面临波动性和高成本工作负载的公司的门槛。在云端部署LLMs相对容易,但需要为此付出代价,特别是在所有开发人员同时开始这么做时。而在自己的场所部署这些对计算能力和网络连接要求较高的资产则更加困难,杜塔警告说。你该如何相应地配置硬件?如何进行容量规划和成本分析?“那么,如何才能获得那个‘一键部署’的功能,用于部署我的大型语言模型以及构建AI代理所需的其他一切呢?”他说。随着我们从简单的聊天机器人发展到基于RAG的LLM与私有公司数据交互,再到由多个模型组成的更复杂的代理模型,这种需求变得更加迫切。这就是Nutanix企业AI发挥作用的地方,杜塔解释道。它是一个单一的控制点,可以运行公司的所有LLM和代理端点,具备三大目标:简化性、全面控制和可预测的成本。Nutanix企业AI现在是GPT-in-a-Box 2.0解决方案的一部分,这是Nutanix的全栈解决方案,用于快速生成式AI部署。在客户在GPT-in-a-Box 2.0中设置好预验证的生成式AI工具和用例后,企业AI部分提供了LLM的第二天操作和管理能力。简化即力量这种简化性体现在产品的集中式架构中。它允许管理员从NVIDIA推理微服务(NIM)和Hugging Face部署LLM,并且可以选择上传自己的自定义模型,甚至是在离线环境中。他们可以从一个单一的控制点安装和管理这些模型,无论是利用Nutanix Kubernetes平台在裸机硬件上本地部署,还是在Google、Amazon和Microsoft等云中的CNCF认证Kubernetes环境中运行。
将管理员置于对这些计算密集型资源的掌控之中
Nutanix企业AI的全面控制和成本管理方面是相互关联的。部署后,管理员可以使用Nutanix企业AI为每个开发人员生成安全访问API令牌。开发人员不是直接访问模型,而是通过这些API令牌访问端点,这些端点是运行在GPU支持的基础架构上的模型实例,并通过安全的API暴露出来。管理员可以为开发人员授予基于角色的端点访问权限。这与传统且不够成熟的开发模式不同,在传统模式中,开发人员可以自主设置自己的模型——这种方法有望带来显著的成本效益提升。“对于任何应用程序,平均而言你会看到大约四到五个LLM,”杜塔说。“现在想象一下我们100个人都试图设置这些模型。企业IT部门需应对安全性、额外的管理负担以及不断攀升的成本。”将管理员置于对这些计算密集型资源的掌控之中,从而更有效地管控模型使用并管理成本。“我们已经看到客户非常欣赏企业IT拥有统一控制层这一事实,”杜塔解释说。
Nutanix与NVIDIA的合作
作为一个供应商中立的解决方案,Nutanix可以在各种硬件上工作,但这并没有阻止它与特定硬件合作伙伴建立更紧密的集成关系。这自然包括房间里的大猩猩:NVIDIA。Nutanix支持NVIDIA在其裸机和Kubernetes部署中运行。
Nutanix企业AI与NVIDIA NIM集成,用于部署和操作生成式AI模型。Nutanix软件让在需要的地方——无论是数据中心还是公共云中——部署NIM更加容易。Nutanix软件还支持NVIDIA的Dynamo产品,这是一个具有缓存功能的分布式推理引擎。
“这些都是令人惊叹的乐高积木。但如果100个人都在做同样的事情,就会导致混乱,”杜塔说。通过Nutanix企业AI进行管理,能让客户更好地掌控。
Nutanix支持NVIDIA在其裸机和Kubernetes部署中运行。Nutanix企业AI与NVIDIA NIM集成,用于部署和操作生成式AI模型。Nutanix软件让在需要的地方——无论是数据中心还是公共云中——部署NIM更加容易。
与NVIDIA合作使Nutanix能够对其硬件合作伙伴的服务器和GPU等设备上的NIM进行验证和认证。这确保NIM能在Nutanix客户选择运行的任何地方正常运行。
Nutanix支持NVIDIA在其裸机和Kubernetes部署中运行。Nutanix企业AI与NVIDIA NIM集成,用于部署和操作生成式AI模型。Nutanix软件让在需要的地方——无论是数据中心还是公共云中——部署NIM更加容易。
Nutanix还针对NVIDIA自己的AI Enterprise软件堆栈对其Enterprise AI软件进行了认证,包括NVIDIA为常见场景提供的蓝图及其完整的推理引擎套件。
Nutanix支持NVIDIA在其裸机和Kubernetes部署中运行。Nutanix企业AI与NVIDIA NIM集成,用于部署和操作生成式AI模型。Nutanix软件让在需要的地方——无论是数据中心还是公共云中——部署NIM更加容易。
代理AI的未来
杜塔表示,这只是代理AI的开始,他预见其将以快速的步伐发展。随着推理模型的能力增强,它们将开启新的可能性,他说。“当这种分析思维过程应用于AI代理时,创建数字小精灵已指日可待,”他说。他对成为现实世界中的格鲁(当然没有邪恶的部分)感到非常高兴,指挥着他在数字劳动力中的数百个可爱的小代理角色。
杜塔警告说,单个小精灵不会擅长所有事情:“从计算和能源的角度来看,创造一个全能的小精灵是非常困难且昂贵的。”相反,他预见每个代理小精灵将在相对狭窄的任务上表现出色。也许这里有一个负责预约的小精灵,那里有一个擅长总结票务历史的小精灵。或许还有一个擅长多源检索和研究排名的小精灵。
随着这些代理系统——本质上是强化版的AI驱动微服务——逐渐普及,公司需要有能力管理它们所创建的计算密集型服务网络。因此,杜塔认为Nutanix有一个光明的未来,因为它助力客户更高效地管理这些服务,以供使用的开发人员使用。
由Nutanix赞助
(以上内容均由Ai生成)