使用基于 Windows 的 AI 工作站加速 AI 开发

快速阅读: 据《Microsoft Windows 博客》称，借助Windows AI工厂，开发者可在多种硬件上高效部署自定义AI模型。强大工作站结合本地开发优势，提升隐私、降低成本并加速迭代。展示的戴尔、惠普、联想工作站满足不同需求，助力AI开发创新。

今天，我们借助Windows AI工厂的强大功能实现人工智能开发，让开发者能够引入自己的模型，并在包括AMD、英特尔、英伟达和高通在内的广泛的硅合作伙伴生态系统中高效部署，涵盖CPU、GPU、NPU（神经处理单元）。这项技术用于优化性能和提高效率，在快速发展的AI开发领域，拥有强大的硬件与可靠的软件和工具同样重要。

我们了解到开发者需要配备先进CPU、GPU和专用处理器（如NPU）的强大工作站，这些处理器具备超快的内存和存储能力，以便移动大量数据，以应对AI任务（如数据处理、模型训练、微调、推理和部署）的密集计算需求。

一个强大的基于Windows的工作站与可靠平台（如Windows AI工厂）相结合，可以帮助AI开发者简化工作流程、减少延迟并实现实时处理能力。您的AI堆栈，您的机器：基于Windows的工作站案例

对于AI开发者来说，工作站不仅仅是一台强大的机器；它是一种关键资产，可以增强他们高效开发、测试和部署AI模型的能力，更重要的是——本地化操作。它提供了几个关键优势：

**隐私与安全：** 工作站允许本地开发而不依赖互联网连接，确保敏感数据留在设备上，从而最大程度降低安全威胁并保障隐私。

**成本效益：** 通过本地进行微调和推理，开发者可以减少重复的云计算成本。例如，在Copilot+ PC中，本地AI负载正在变得更加节能，降低了总体能耗。

**速度与可靠性：** 开发者可以快速迭代并调试，而无需等待云同步或网络依赖。硬件还支持低延迟推理和高性能用户体验。

选择基于Windows的AI工作站对需要在AI负载中获得速度、灵活性和控制权的Windows开发者尤为重要。它也非常适合利用Visual Code的AI工具包以及Windows AI工厂及其组件（如Foundry Local和Windows ML）的全部功能，这些组件都针对本地工作流进行了优化。

多样化的Windows工作站选项，满足AI开发者工作负载的需求

Windows 11上的AI开发者可以从OEM合作伙伴（如戴尔、惠普、联想等）提供的广泛PC硬件中进行选择。这些系统不仅针对AI模型的微调、推理和部署进行了优化，还通过不同的外形尺寸和价格点为开发者的流程提供了灵活性。

对于需要原始计算能力的开发者，一台配备强大CPU和GPU的台式工作站可以显著缩短本地模型微调的时间。那些寻求物理空间效率的人可能会考虑迷你工作站，而经常出差的开发者则可以从移动工作站中受益，因为它可以在没有稳定网络连接的情况下，允许他们在本地运行专有模型的推理。

在Build 2025大会上，我们展示了来自部分OEM合作伙伴的最新工作站：

**戴尔Pro Max Tower T2台式机**
在散热技术创新方面处于领先地位，是全球单线程应用性能最快的塔式工作站，这得益于戴尔独有的无限制涡轮增压持续技术。这项技术确保设备在持续高强度工作负载下仍能保持卓越性能。涡轮增压持续技术使设备在长时间密集任务中依然表现出色，保持AI应用程序在延长期内高效运行，同时保持良好的散热性能。

Tower将在2025年7月推出，搭载英特尔酷睿Ultra系列处理器，提供高达32GB的DDR5内存、1TB自加密存储和NVIDIA RTX PRO Blackwell Generation GPU。

**惠普ZBook Ultra G1a 14”**
这是一款强大的14英寸移动工作站笔记本电脑，突破了便携性的界限。这款配备了紧凑设计和全新AMD Ryzen AI Max PRO处理器的Copilot+ PC，提供了以前笔记本电脑无法完成的工作流性能。结合超薄轻便设计、持久电池、下一代AI PC功能以及AI增强隐私保护，您可以将桌面绑定的工作流带到任何地方。

ZBook Ultra最多可配置16个桌面级CPU核心、类似独立显卡的集成图形和高达128GB的统一内存架构，并且能够将多达96GB的RAM分配给GPU，使ZBook Ultra能够在应用程序间实现无缝多任务处理。

**惠普Z2 Mini G1a迷你工作站**
配备了AMD Ryzen AI Max PRO处理器和可扩展至128GB的统一内存架构，能够将多达96GB的内存专门分配给GPU，Z2 Mini G1a为图形密集型工作流提供了出色的性能。凭借内置电源，这款PC可以干净地放置在桌面上、显示器后面或桌下。它也容易安装在机架上，其小巧的体积允许高密度机架安装解决方案，结合了性能、可管理性和安全性。

**联想ThinkPad P14s Gen 6移动工作站**
这是一款Copilot+ PC，搭载最新的AMD Ryzen AI PRO 300系列处理器和集成AMD Radeon显卡，已通过ISV认证支持，非常适合2D CAD、轻量级3D设计和内容创作等工作。专为混合职业人士、学生和教育工作者设计，它在紧凑的14英寸机身中实现了性能、安全性和续航能力的良好平衡。

**联想ThinkPad P16s Gen 4移动工作站**
这是一款Copilot+ PC，提供增强的性能、更大的显示屏和更高的配置灵活性。同样由AMD Ryzen AI PRO 300系列处理器提供动力，并针对关键ISV应用程序认证，旨在处理更繁重的工作负载，如3D CAD、BIM建模和数据密集型任务。配备16英寸屏幕、集成AI加速功能及强大的ThinkShield安全功能，它非常适合从事工程、建筑和媒体的专业人士。

工作站在开发人员工作流中的优势示例

在Dell Pro Max Tower T2上使用Intel Core Ultra 7处理器和NVIDIA RTX PRO 6000 Blackwell GPU进行微调

在工作站上进行本地微调通过提供一种快速、强大且简便的方法来运行和调试您的原型，从而在将最终工作流迁移到云端之前在本地进行操作，从而提高开发人员的生产力。使用Dell Pro Max Tower T2，我们使用NVIDIA GPU和AI工具包中的LoRA（低秩适应）以及包含51,760个提示的alpaca-cleaned数据集对微软的Phi-4-mini模型进行了微调。对于批量大小为8个提示的系统，能够每秒反向传播2.16个批次，在约2小时15分钟内完成3轮完整的微调。由于网络往返延迟及云计费的额外费用，相同的流程在云端可能需要长达一天的时间才能完成。

**示例1：在Dell Pro Max Tower T2上基于NVIDIA RTX PRO 60000 GPU本地微调Phi-4-mini模型（提升了150倍的速度）**

**AIAnywhere：随时随地利用GPU的强大性能**

全新HP ZBook Ultra G1a 14”，由AMD Ryzen AI Max+ PRO 395提供动力，是一款Copilot+ PC，利用CPU、GPU和NPU的能力在各种工作流程中最大化性能和资源。

**示例2：在HP ZBook Ultra G1a 14”上本地加载和运行70b DeepSeek R1**

在一个用例中，我们使用VS Code的AI工具包来本地加载和运行一个大型70b参数DeepSeek R1模型——对移动工作站而言是一项令人瞩目的成就。

**示例3：在HP ZBook Ultra G1a 14”笔记本电脑上同时运行SDXL和Phi-4 Mini**

在另一个用例中，我们同时运行了Stable Diffusion XL（SDXL）模型和Phi-4 Mini CPU ONNX模型。图像生成以约3到6it/sec的速度并发运行，而文本生成任务在7到17tokens/sec内完成。从任务管理器可以看出，GPU被充分利用以发挥最大处理性能。NVMe SSD使其成为这类高性能应用的理想之选。要同时运行图像生成和文本生成，通常需要具备足够算力、内存和存储的系统。虽然桌面设置可以满足这些要求，但HP ZBook Ultra G1a 14”笔记本电脑能在紧凑的形态下处理这些任务，实现随时随地的高效工作。

为基于Windows的工作站上的未来AI构建

预计到2027年，60%的PC出货将具备设备端AI功能，推动本地运行AI模型的边界。拥有合适的工作站不仅能加速开发周期，还能确保AI模型在广泛的CPU、GPU和NPU上运行。了解可用选项的广度并投资于合适的工作站能显著提升开发人员在竞争激烈的AI领域的创新能力与成功几率。

为了推动创新，软件和硬件必须协同一致。我们不仅鼓励开发者查看Windows AI工厂，还鼓励开发者利用基于Windows的AI工作站中的最新硬件以获得最佳开发体验。

1 戴尔Pro Max Tower T2是世界上单线程应用程序性能最快的设备——基于2025年2月对入门级工作站领域竞争对手的内部分析，联想P3 Ultra、惠普Z2 G9 Mini、惠普Z2 G1a Mini和联想P3 Tiny。

2 基于Canalys的报告《AI能力PC的现在与未来：革命性计算：AI PC及其市场展望》。（2024年1月）

(以上内容均由Ai生成)