使用 Agentic AI 简化企业 AI 的采用和扩展
快速阅读: 《Dell Technologies》消息,戴尔与英伟达合作推出AI工厂,提供从基础设施到软件的全栈AI解决方案,助力企业简化AI部署、优化工作负载并扩展AI能力,推动业务智能化升级。
企业正寻求采用人工智能以提升业务成果,这要求它们评估数据需求、优化和自动化人工智能工作流程,并为未来发展扩展硬件和应用程序。最新在市场上掀起浪潮的人工智能创新是具代理能力的人工智能——一种智能且适应性强的能力,旨在为企业提供自主决策和自动化工作流的能力。这项创新简化了复杂性,并为更智能、更快的洞察开辟了新路径。
企业正寻求采用人工智能以提升业务成果,这要求它们评估数据需求、优化和自动化人工智能工作流程,并为未来发展扩展硬件和应用程序。为了使企业能够获得包括具代理能力人工智能在内的新的人工智能能力,戴尔与英伟达的AI工厂宣布了四项关键内容:
– 通过基于英伟达企业参考架构的设计最佳实践实现基础设施扩展。
– 借助具代理能力人工智能增强功能和新推理模型带来新的自动化功能。
– 使用英伟达Run:AI设计指南管理加速计算基础设施,以实现最佳GPU利用率。
这些创新共同为IT人员和应用开发者简化人工智能应用,化解复杂性并实现加速效果。
**解锁高性能人工智能工作负载**
当今现代人工智能工作负载需要计算能力和可扩展的基础设施来处理不断增长的人工智能工作负载,随着各部门在整个组织中加快项目进度。戴尔与英伟达联合推出了全新的人工智能服务器——戴尔PowerEdge XE7740和XE7745服务器,搭载最新的英伟达H200 NVL平台。这些服务器为部署戴尔与英伟达的AI工厂的企业环境带来全新性能和灵活性。它们支持高带宽处理,并支持最新英伟达GPU平台,满足苛刻的人工智能应用场景。
新的英伟达H200 NVL平台通过更大、更快的HBM3e内存和高达四块GPU的英伟达NVLink™连接,为普通企业服务器释放人工智能加速能力。H200 NVL可以在几小时内微调大型语言模型(LLMs),并提供高达1.7倍更快的LLM推理性能。它附带五年期的英伟达人工智能企业订阅服务,这是一个用于开发和部署生产级端到端人工智能管道的云原生软件平台。英伟达人工智能企业包含英伟达NIM微服务,用于安全、可靠地部署高性能人工智能模型推理。
戴尔PowerEdge XE7740和XE7745服务器,搭载最新的英伟达H200 NVL平台,为部署戴尔与英伟达的AI工厂的企业环境带来全新性能和灵活性。这些人工智能服务器支持高带宽处理,并支持最新英伟达GPU平台,满足苛刻的人工智能应用场景。配备H200 NVL平台的PowerEdge服务器将于2025年下半年上市。
**简化人工智能扩展**
在多样化的企业环境中构建和扩展人工智能解决方案可能是一项繁琐且昂贵的任务。戴尔与英伟达的AI工厂帮助客户根据英伟达企业参考架构(Enterprise RA)的最佳实践进行扩展。Enterprise RA包括部署指南,由英伟达认证系统、英伟达Spectrum-X网络、英伟达人工智能企业软件以及经过优化以支持多种工作负载、灵活集群大小和扩展需求的英伟达认证存储解决方案组成。客户通过实施稳健的人工智能就绪基础设施受益匪浅,消除在部署人工智能框架时的猜测,并避免系统配置不匹配的问题。通过最佳工作负载部署实践,IT可以确保构建具有最佳性能的人工智能解决方案。
戴尔与英伟达的AI工厂的新解决方案将专注于实现高可用性网络,基于英伟达企业推荐配置和最佳实践的英伟达Spectrum-X以太网平台。
**赋予人工智能代理能力**
对于许多企业而言,调整人工智能工作流程以定制特定业务目标的解决方案可能是复杂且耗时的。随着人工智能代理作为提高生产力的新方法兴起,IT和开发者正在寻找利用代理并改进结果的方式。在英伟达GTC的公告后,代理型人工智能时代为应用程序开发人员带来了新能力,包括英伟达AI-Q蓝图和英伟达Agent-IQ工具包,这些已集成到英伟达的高级产品中,并赋予企业在戴尔与英伟达的AI工厂上构建强大人工智能代理平台的能力。
戴尔在SC24上发布了代理型RAG,现在戴尔用户、企业开发者和IT部门在部署戴尔与英伟达的AI工厂时,可以利用英伟达人工智能企业套件中的增强功能,构建、部署和管理由人工智能代理组成的数字劳动力。借助英伟达AI-Q蓝图,开发人员可以构建、优化并加速具有推理、协作和解锁知识能力的AI代理团队,扩展企业的数字劳动力。
英伟达AgentIQ工具包是一个开源库,用于高效连接、分析和优化AI代理团队。通过它,开发人员可以轻松加速和评估企业就绪的具代理能力AI系统。英伟达人工智能企业中的这两种创新功能赋予客户访问端到端软件套件的权利,该套件旨在构建简化部署并自动处理复杂决策的人工智能代理,从而优化戴尔与英伟达的AI工厂中的AI性能。
借助英伟达AI-Q蓝图,开发人员可以构建、优化并加速具有推理、协作和解锁知识能力的AI代理团队,扩展企业的数字劳动力。带有AI代理的生成式人工智能工作流与戴尔与英伟达的AI工厂一起能够更高效地处理企业数据,提供更智能和针对性的输出。具代理能力人工智能增强功能将在本季度推出。
**优化人工智能工作负载编排**
组织和站点对加速计算和扩展人工智能部署的需求日益增长,使得IT的工作负载管理任务变得愈发复杂。如果没有适当的管理和可见性,可用的GPU周期可能会被浪费,人工智能工作负载可能会变得低效。英伟达Run:AI通过强大的工作负载编排平台解决了这一挑战,简化了人工智能操作。通过高效分配工作负载并最大化GPU利用率,该工具确保边缘、数据中心和云环境下的资源顺畅共享。
英伟达Run:AI的设计指南现已发布。
**面向未来的组织**
这四项创新共同重塑了企业人工智能领域,为IT人员和应用开发者提供了工具,简化人工智能应用,化解复杂性并实现加速效果。戴尔科技与英伟达的持续创新确保组织能够快速扩展并利用最新技术,通过戴尔与英伟达的AI工厂部署人工智能。
戴尔与英伟达的AI工厂是业内首个且唯一的端到端企业AI解决方案,旨在通过交付集成的戴尔与英伟达能力加速您的AI驱动用例,整合您的数据和工作流,并让您设计自己的AI旅程,以实现成功的、可扩展的结果。
欲了解更多,请点击此处访问我们在戴尔展位#1423。
1基于戴尔分析,2024年7月。戴尔提供基于英伟达硬件和软件的解决方案,这些方案涵盖从支持AI功能的PC和工作站到高性能计算服务器、数据存储、云原生软件定义基础设施、网络设备、数据保护、超融合基础设施(HCI)及服务等各类AI工作负载。
(以上内容均由Ai生成)