AI

华为全面开源CUDA版本,加速计算领域再进一步

发布时间:2025年8月6日    来源:szf
华为全面开源CUDA版本,加速计算领域再进一步

快速阅读: 7月11日,华为宣布开源昇腾AI GPU的CANN软件工具包,支持用户自主挖掘昇腾GPU潜力,加速开发者创新。同日,Raja Koduri创立Oxmiq Labs,专注开发GPU硬件和软件IP,挑战英伟达CUDA生态系统。

最新消息,华为宣布为其昇腾AI GPU 开源 CANN 软件工具包。在昇腾计算产业发展峰会上,华为轮值董事长徐直军发表主题演讲,强调华为 AI 战略的核心在于算力,并表示将坚持昇腾硬件变现。在此背景下,华为宣布 CANN 架构全面开源开放,Mind 系列应用使能套件及工具链也同步开源,支持用户自主深度挖掘昇腾 GPU 的潜力,加速开发者的创新步伐,让昇腾更易用、更好用。

CANN 是一种神经网络计算架构,提供多层编程接口,帮助用户构建针对华为昇腾的 AI 应用程序。作为一个由多种技能栈和算子加速库组成的软件生态系统,CANN 类似于华为版本的 CUDA,为 GPU 提供相同的接口。

巧合的是,同一天,一家由传奇 GPU 架构师创办的公司浮出水面。该公司不开发消费级 GPU,而是专注于类似 CUDA 的软件生态系统。这表明,挑战英伟达 CUDA 生态系统的玩家越来越多。

过去,开发者因 CUDA 封闭生态系统而受限。CUDA 几乎不支持其他第三方硬件,导致开发者只能使用英伟达的 GPU。这种封闭性构成了英伟达的核心壁垒。一旦开发者希望迁移到其他产品,就需要重写代码,使用生态相对不成熟的替代库,同时失去英伟达庞大的技术社区支持。此前,一些项目试图通过转换层将 CUDA 功能引入其他 GPU 供应商,但因英伟达的阻挠大多未能成功。自 2024 年 CUDA 11.6 版本起,使用转换层被禁止。

目前,CANN 已经升级到 8.0 版本,提供社区版和商业版两个版本。社区版提供新功能的早期体验,商业版则为企业用户提供稳定的定制版本。两个版本均已更新至 8.2.RC1,新增适配 12 款操作系统。与 CANN 配套的还有华为自研的深度学习框架 MindSpore,类似于 PyTorch,这些工具共同构成华为的 AI 软硬件解决方案。CANN 已支持 PyTorch、MindSpore、TensorFlow、飞桨、ONNX、计图、OpenCV 和 OpenMMLab 等多个深度学习框架和第三方库。会上,与会代表和华为共同发起了《CANN 开源开放生态共建倡议》。

与此同时,传奇 GPU 架构师 Raja Koduri 宣布创立 GPU 初创公司 Oxmiq Labs。他曾效力于 AMD、苹果和英特尔,担任过英特尔加速计算系统和图形业务的执行副总裁。Oxmiq Labs 专注于开发 GPU 硬件和软件 IP,并将其授权给各方。该公司不开发消费级 GPU,而是提供一个垂直集成平台,结合 GPU 硬件 IP 和功能齐全的软件堆栈,以满足 AI、图形和多模态工作负载的需求。

在硬件方面,Oxmiq 提供基于 RISC-V 指令集架构的 GPU IP 核 OxCore,该核集成了标量、矢量和张量计算引擎,支持近内存和内存计算功能。此外,Oxmiq 还提供基于芯片集的系统级芯片构建器 OxQuilt,使客户能够根据特定工作负载需求,快速且经济高效地创建集成计算集群桥接器、内存集群桥接器和互连集群桥接器模块的 SoC。

Oxmiq 的软件业务更为核心,其软件包可以兼容第三方硬件,支持在各种硬件平台上部署 AI 和图形工作负载。软件堆栈的核心是 OXCapsule,用于管理工作负载分配、资源平衡和硬件抽象。OXPython 是该堆栈的一个重要组件,它可以将 CUDA 为中心的工作负载转换为 Oxmiq 的运行时,使基于 Python 的 CUDA 应用程序在非英伟达硬件上无需修改即可运行,无需重新编译。尽管 OXPython 最初将在 Tenstorrent 的 Wormhole 和 Blackhole AI 加速器上发布,但其设计本质上独立于 Oxmiq 硬件。

无论最终结果如何,竞争的号角已经吹响,最终受益的还是开发者。

(以上内容均由Ai生成)

你可能还想读

微软Windows 11 Copilot如何卸载

微软Windows 11 Copilot如何卸载

快速阅读: 微软宣布Windows 11更新,引入Copilot为核心的人工智能助手,实现文本语音互动、指导支持及代理操作。此举虽与谷歌等公司类似,但引发部分用户隐私担忧,微软已调整部分AI功能计划。 上周,微软宣布了一系列更新,使每一台W […]

发布时间:2025年10月23日
NEXCOM推出新平台,加速AI洞察

NEXCOM推出新平台,加速AI洞察

快速阅读: NEXCOM,总部位于中国台湾,自1992年成立以来,通过其NCS部门提供涵盖网络安全、SD-WAN、5G uCPE等领域的先进平台,助力企业构建可靠、可扩展的网络基础设施,推动未来连接技术发展。 成立于1992年,总部位于中国 […]

发布时间:2025年10月23日
Zonetail与FUTR在加拿大推出AI租房报告计划

Zonetail与FUTR在加拿大推出AI租房报告计划

快速阅读: Zonetail与The FUTR Corporation合作,推出加拿大首个人工智能驱动的租金报告项目,租户支付租金可建立信用并获FUTR代币奖励,2025年四季度启动,初期覆盖12,000个单位,计划2026年初扩展至70, […]

发布时间:2025年10月23日
Meta联手Blue Owl资本,270亿美元打造AI数据中心巨无霸项目

Meta联手Blue Owl资本,270亿美元打造AI数据中心巨无霸项目

快速阅读: Meta与Blue Owl Capital合作,成立270亿美元合资企业,开发路易斯安那州Hyperion数据中心园区,占地2,250英亩,使用SPV结构融资,Meta持有20%股份,项目计划2030年前完成,初期计算能力2吉瓦 […]

发布时间:2025年10月23日
CoreWeave推出专为AI优化的高速对象存储

CoreWeave推出专为AI优化的高速对象存储

快速阅读: CoreWeave推出专为AI工作负载优化的对象存储,解决GPU驱动任务中数据移动瓶颈,提高数据访问速度和效率,支持大规模模型训练,减少成本和操作复杂性。 在部署人工智能工作负载时,随着对数据需求量大的模型的压力增大,存储架构中 […]

发布时间:2025年10月23日
亚马逊展示智能眼镜和机器人,加速最后一公里配送

亚马逊展示智能眼镜和机器人,加速最后一公里配送

快速阅读: 亚马逊在“未来交付”活动上展示智能配送眼镜Amelia,内置小屏提供导航和扫描功能,旨在提高配送效率和安全性,已开始实地测试,同时推出新机器人和AI系统优化仓储与配送流程。 在位于加州米尔皮塔斯的DUR3配送站举行的“未来交付” […]

发布时间:2025年10月23日
Meta裁减AI部门600岗位,加速全球竞赛

Meta裁减AI部门600岗位,加速全球竞赛

快速阅读: Meta重组AI部门,计划裁员600人,旨在缩小规模、加快决策,增强竞争力。首席AI官Alexandr Wang宣布,此举涉及产品、基础设施及研究团队,但TBD实验室不受影响。 Meta正在对其人工智能部门进行重组,计划裁员约6 […]

发布时间:2025年10月23日
马斯克计划年底前扩大特斯拉无人出租车运营范围

马斯克计划年底前扩大特斯拉无人出租车运营范围

快速阅读: 特斯拉计划年底前在8至10个新州推出机器人出租车,包括内华达、佛罗里达和亚利桑那,需克服监管障碍。奥斯汀现有约20辆车,行驶超25万英里,旧金山超100万英里。 马斯克还表示,特斯拉计划在年底前在8到10个新的州运营机器人出租车 […]

发布时间:2025年10月23日