SiFive推出第二代RISC-V智能处理器,拓展AI市场
快速阅读: SiFive推出第二代智能家族RISC-V处理器IP,涵盖五款新产品,从物联网到数据中心应用,提升AI算法优化和内存子系统性能,支持BF16格式和向量加密扩展,具备SCCI和VCIX接口,增强AI加速器集成,显著提升性能。
SiFive 近日宣布推出第二代智能家族系列新品,涵盖从远边缘物联网设备的超低功耗设计到数据中心的高性能引擎,以及介于两者之间的各种产品。SiFive 第二代智能家族 RISC-V 处理器 IP 包括五款新产品——全新的 X160 Gen 2 和 X180 Gen 2,以及升级版的 X280、X390 和 XM 核心。
SiFive 第二代智能家族不仅扩大了公司在远边缘和嵌入式 AI 领域的市场覆盖范围,还提升了性能和功能,以应对云环境中更为复杂的数据推理和训练需求。这些设计针对 AI 算法进行了优化,改进了内存子系统,具有可配置缓存和新的内存延迟容忍机制,有助于在高负载下掩盖延迟并最大化吞吐量。此外,该系列支持更多数据类型,包括广泛用于 AI 训练的 BF16 格式和向量加密扩展,进一步扩展了工作负载的适用范围。
SiFive 第二代智能家族的五大新成员分别为:X160 Gen 2 专为物联网和边缘计算优化,体积小巧,能效出色;X180 Gen 2 则提供了更强的边缘推理能力,并支持数据中心环境下的集成选项;X280 Gen 2 面向智能家居和可穿戴设备;X390 针对工业边缘和移动应用;XM Gen 2 提供广泛的向量和矩阵计算能力,适用于大型语言模型(LLMs)和其他高性能应用。
SiFive 第二代智能家族的一个显著特点是其向量支持的 RISC-V 架构。与标量设计不同,这些向量支持的核心能够并行处理多个数据项,从而减少指令开销和功耗,尤其适合使用较小数据类型的 AI 模型。
除了更新核心功能外,SiFive 还推出了新的或更新的接口,以实现与 AI 加速器等高级组件的更紧密集成。这些接口被称为 SSCI(SiFive 标量协处理器接口)和 VCIX(向量协处理器接口),旨在让所有 SiFive 的智能核心都能作为加速器控制单元(ACU),以低延迟管理定制的 AI 加速器。SSCI 可通过 RISC-V 自定义指令驱动加速器,并提供对 CPU 寄存器的直接访问和灵活的指令操作码范围。VCIX 则提供对处理器向量寄存器的高带宽访问,使用常见的向量类型指令格式。
SiFive 声称其新产品在性能上取得了显著提升。在 MLPerf Tiny 基准测试中,X160 Gen 2 在关键字识别、图像分类和异常检测等任务上的表现是同类竞品的两倍,尽管其体积同样小巧。这些任务对于可穿戴设备、智能家居装置和工业边缘系统等市场至关重要,这些市场的计算资源有限,但对 AI 能力的需求日益增加。而在高端市场,XM Gen 2 可扩展至数千个 TOPS,适合数据中心级别的生成式 AI 工作负载。这正是 SiFive 技术的关键差异化因素——其可扩展性和定制选项使得处理器可以针对多种应用和工作负载进行调优和定制。
此外,SiFive 在软件堆栈方面也做了大量工作。其框架与 TensorFlow Lite、ONNX Runtime 和 Llama.cpp 等流行的 AI 运行时和库集成,并提供自己的编译器扩展和内核库。
此次发布的时机也值得注意。SiFive 引用的研究表明,AI 正在加速 RISC-V 的采用,预计未来几年 RISC-V AI 处理器的出货量将迅速增长。德勤的数据指出,AI 工作负载在所有计算领域增加了 20%,而边缘工作负载预计增长近 80%。
在开放的RISC-V架构下,SiFive无需支付授权费用并能实现定制化,但其面临的挑战是如何与已有的市场领导者竞争。例如,Arm、英特尔和英伟达等公司已经提供了经过AI优化的处理器IP和加速器,并拥有强大的软件生态系统。然而,SiFive采取了一种独特的方法,通过将高效的标量/矢量计算与灵活的加速器控制接口相结合,减少了对专有互连或中间件的依赖,从而将其IP定位为成本效益高且适应性强的产品。
如果SiFive能够证明其第二代智能家族产品可以降低AI开发难度,同时达到性能和效率目标,那么它有望在边缘市场占据更强的地位,并在数据中心的AI部署中找到一席之地。不过,成功的关键在于执行,特别是与软件框架的兼容性和在生产硅片中的可扩展性,预计这些硅片将在2026年第二季度推出。
SiFive将在9月9日至11日于加利福尼亚州圣克拉拉举行的AI基础设施峰会上讨论这些新内核(展位#908)。目前,第二代智能家族内核已被多家顶级芯片制造商采用,所有五款新产品均立即可供授权。
(以上内容均由Ai生成)