GPU 还是 AI 加速器?哪个是正确的选择 [Q&A]
快速阅读: 《Beta新闻》消息,随着AI应用增多,GPU需求大增,但AI加速器因其成本效益和性能优化也备受关注。IBM与英特尔合作,在IBM云中引入英特尔Gaudi 3加速器,助力生成式AI工作负载,强调灵活选型和定制化方案的重要性。
随着企业推出更多的人工智能应用,对提供满足特定人工智能工作负载需求的计算能力的GPU需求大幅增加。但GPU并非唯一的选择,客户在寻求业务上的多样性和灵活性时,对人工智能加速器的兴趣日益浓厚。上个月,英特尔和IBM宣布了一项合作,将在IBM云中提供英特尔加迪3代(Gaudi 3)人工智能加速器。随着企业推出更多的人工智能应用,对提供满足特定人工智能工作负载需求的计算能力的GPU需求大幅增加。我们采访了IBM云产品和行业平台总经理罗希特·巴德兰尼(Rohit Badlaney)以及英特尔数据中心人工智能战略与产品管理副总裁索拉布·库尔卡尼(Saurabh Kulkarni),讨论人工智能芯片和加速器的演变格局。
**BN**:你能解释一下人工智能加速器和GPU之间的区别吗?
**RB**:GPU是最初为图形设计的一般用途处理器,但也广泛用于人工智能和高性能计算工作负载,因为它们具有并行处理能力。虽然在人工智能训练方面非常有效,但GPU可能不是推理任务最有效的解决方案。人工智能加速器,如张量处理单元(TPU)和专用集成电路(ASIC),专为人工智能任务而设计,提供优化的性能和能效,特别是在大规模推理方面表现出色。这些加速器在速度和能效至关重要的环境中表现优异。
**BN**:你能解释一下人工智能加速器和GPU之间的区别吗?
**SK**:英特尔的加迪3代(Gaudi 3)人工智能加速器是专门为特定的人工智能工作负载设计的。虽然它与GPU有相似之处,比如处理大量并行数据,但它围绕深度学习的独特需求特性进行了优化,例如针对大型语言模型(LLM)的推理和微调,以及大规模推理。像加迪这样的AI加速器通常在特定的生成式人工智能(GenAI)任务中带来更好的性能、成本和效率。
**BN**:为什么最近人工智能加速器在企业中获得了更多的关注?
**RB**:人工智能加速器正在成为一种替代GPU的选择,因为它们的总体拥有成本可以显著减少。GPU可以驱动大规模的人工智能工作负载,但许多企业不需要如此强大的计算能力来处理较不密集的人工智能工作负载,因此加速器可以帮助降低成本,同时保持高水平的可扩展性和效率。
**SK**:此外,人工智能加速器受到关注是因为企业正在从人工智能实验转向大规模部署。特别是随着生成式人工智能模型的复杂性增加,传统的CPU可能无法始终满足大规模训练和推理的需求。专门设计的硅片加速器如加迪旨在处理人工智能工作负载的并行处理需求,帮助企业实现更好的性能、更快的价值回报并提高成本效率。
**BN**:企业在定制其人工智能方法时需要考虑哪些因素?
**RB**:企业在定制其人工智能方法时的一个关键考虑因素是,人工智能基础设施没有一刀切的方法,就像混合云也没有一刀切的方法一样。尤其是在高度监管行业的企业,需要有一个战略性设计的混合人工智能架构,以支持数据隐私和安全,同时推动创新。企业需要专注于理解其业务流程和应用程序的独特性,然后根据数据应驻留在哪个环境来制定工作负载部署策略。这些决策应基于弹性、性能、安全性、合规性和总拥有成本,以便企业能够在整个IT资产中采用全栈方法。IBM云为企业提供了独特的平台,通过基于可信云架构构建的混合人工智能堆栈来实现这些目标。
**BN**:企业在定制其人工智能方法时需要考虑哪些因素?
**SK**:我同意这不是一刀切的方法。事实上,企业还需要明确其人工智能目标,无论是提高运营效率、提升客户体验,还是开发新产品和服务。然后,数据的质量和可用性至关重要。管理从数据采集到处理的全流程以满足数据本地化要求、安全和隐私要求对于企业在做出基础设施相关决策时收集、存储和管理数据至关重要。最后,企业还应该培养持续学习的文化,以适应快速变化的人工智能领域。拥有正确的工具和正确的协作是有效适应和扩展解决方案的关键。
**BN**:企业在定制其人工智能方法时需要考虑哪些因素?
**BN**:IT经理在进行处理器选型时需要考虑哪些因素?
**RB**:在GPU和人工智能加速器之间没有绝对的“最优解”。当IT经理做出决定时,选择需要基于他们需要完成的具体人工智能工作负载。类似于工作负载部署策略,企业需要根据模型大小、并发用户数量、吞吐量和延迟要求来分析其人工智能工作负载,以确定最佳的延迟和成本选项。
**SK**:在此基础上,我们的角色是引导客户回答这些问题,并帮助他们识别最高效、可扩展且经济实惠的解决方案——无论是GPU、人工智能加速器、CPU还是混合部署。目标不是选择最强大的选项,而是最适合的选项。
**BN**:IBM和英特尔如何合作以支持生成式人工智能工作负载?
**RB**:IBM和英特尔都致力于将人工智能带给企业,并在他们的AI创新旅程中满足共同客户的需求。我们旨在帮助客户更高效地测试、创新并部署生成式AI解决方案,同时平衡驱动性能所需的基础设施成本。数据安全与信任是我们工作的核心,我们正与英特尔等关键合作伙伴合作,将这种方法提供给客户。借助IBM云中的英特尔加迪3代(Gaudi 3)人工智能加速器,我们正为客户提供所需的选择,以满足其特定的人工智能需求。
**BN**:IBM和英特尔如何合作以支持生成式人工智能工作负载?
**图片来源**:Dmytro Lopatin/Dreamstime.com
(以上内容均由Ai生成)