AI

华为全面开源CUDA版本,加速计算领域再进一步

发布时间:2025年8月6日    来源:szf
华为全面开源CUDA版本,加速计算领域再进一步

快速阅读: 7月11日,华为宣布开源昇腾AI GPU的CANN软件工具包,支持用户自主挖掘昇腾GPU潜力,加速开发者创新。同日,Raja Koduri创立Oxmiq Labs,专注开发GPU硬件和软件IP,挑战英伟达CUDA生态系统。

最新消息,华为宣布为其昇腾AI GPU 开源 CANN 软件工具包。在昇腾计算产业发展峰会上,华为轮值董事长徐直军发表主题演讲,强调华为 AI 战略的核心在于算力,并表示将坚持昇腾硬件变现。在此背景下,华为宣布 CANN 架构全面开源开放,Mind 系列应用使能套件及工具链也同步开源,支持用户自主深度挖掘昇腾 GPU 的潜力,加速开发者的创新步伐,让昇腾更易用、更好用。

CANN 是一种神经网络计算架构,提供多层编程接口,帮助用户构建针对华为昇腾的 AI 应用程序。作为一个由多种技能栈和算子加速库组成的软件生态系统,CANN 类似于华为版本的 CUDA,为 GPU 提供相同的接口。

巧合的是,同一天,一家由传奇 GPU 架构师创办的公司浮出水面。该公司不开发消费级 GPU,而是专注于类似 CUDA 的软件生态系统。这表明,挑战英伟达 CUDA 生态系统的玩家越来越多。

过去,开发者因 CUDA 封闭生态系统而受限。CUDA 几乎不支持其他第三方硬件,导致开发者只能使用英伟达的 GPU。这种封闭性构成了英伟达的核心壁垒。一旦开发者希望迁移到其他产品,就需要重写代码,使用生态相对不成熟的替代库,同时失去英伟达庞大的技术社区支持。此前,一些项目试图通过转换层将 CUDA 功能引入其他 GPU 供应商,但因英伟达的阻挠大多未能成功。自 2024 年 CUDA 11.6 版本起,使用转换层被禁止。

目前,CANN 已经升级到 8.0 版本,提供社区版和商业版两个版本。社区版提供新功能的早期体验,商业版则为企业用户提供稳定的定制版本。两个版本均已更新至 8.2.RC1,新增适配 12 款操作系统。与 CANN 配套的还有华为自研的深度学习框架 MindSpore,类似于 PyTorch,这些工具共同构成华为的 AI 软硬件解决方案。CANN 已支持 PyTorch、MindSpore、TensorFlow、飞桨、ONNX、计图、OpenCV 和 OpenMMLab 等多个深度学习框架和第三方库。会上,与会代表和华为共同发起了《CANN 开源开放生态共建倡议》。

与此同时,传奇 GPU 架构师 Raja Koduri 宣布创立 GPU 初创公司 Oxmiq Labs。他曾效力于 AMD、苹果和英特尔,担任过英特尔加速计算系统和图形业务的执行副总裁。Oxmiq Labs 专注于开发 GPU 硬件和软件 IP,并将其授权给各方。该公司不开发消费级 GPU,而是提供一个垂直集成平台,结合 GPU 硬件 IP 和功能齐全的软件堆栈,以满足 AI、图形和多模态工作负载的需求。

在硬件方面,Oxmiq 提供基于 RISC-V 指令集架构的 GPU IP 核 OxCore,该核集成了标量、矢量和张量计算引擎,支持近内存和内存计算功能。此外,Oxmiq 还提供基于芯片集的系统级芯片构建器 OxQuilt,使客户能够根据特定工作负载需求,快速且经济高效地创建集成计算集群桥接器、内存集群桥接器和互连集群桥接器模块的 SoC。

Oxmiq 的软件业务更为核心,其软件包可以兼容第三方硬件,支持在各种硬件平台上部署 AI 和图形工作负载。软件堆栈的核心是 OXCapsule,用于管理工作负载分配、资源平衡和硬件抽象。OXPython 是该堆栈的一个重要组件,它可以将 CUDA 为中心的工作负载转换为 Oxmiq 的运行时,使基于 Python 的 CUDA 应用程序在非英伟达硬件上无需修改即可运行,无需重新编译。尽管 OXPython 最初将在 Tenstorrent 的 Wormhole 和 Blackhole AI 加速器上发布,但其设计本质上独立于 Oxmiq 硬件。

无论最终结果如何,竞争的号角已经吹响,最终受益的还是开发者。

(以上内容均由Ai生成)

你可能还想读

欧洲报告揭示AI新闻助手准确性问题,谷歌Gemini表现最差

欧洲报告揭示AI新闻助手准确性问题,谷歌Gemini表现最差

快速阅读: 欧洲广播联盟和BBC报告显示,AI平台传播新闻存严重风险,影响新闻生态,Perplexity和谷歌AI加剧公众信任下降,研究发现来源、准确性和背景问题是主要障碍。 欧洲广播联盟和BBC发布的一份新报告显示,使用生成式人工智能平台 […]

发布时间:2025年10月23日
AI热潮推动美股大涨,ChatGPT引发21万亿市值增长

AI热潮推动美股大涨,ChatGPT引发21万亿市值增长

快速阅读: 特朗普退让提振市场情绪,但股市上涨主因是AI热潮。自2022年11月ChatGPT推出以来,美国标普500指数市值增加21万亿美元。 特朗普倾向于退让提振了市场情绪,但推动股市上涨的主要动力是围绕生成式人工智能(AI)的炒作。在 […]

发布时间:2025年10月23日
北欧Riff获1600万美元A轮融资,助力企业级AI应用开发

北欧Riff获1600万美元A轮融资,助力企业级AI应用开发

快速阅读: 挪威Riff完成1600万美元A轮融资,累计2100万美元,由Northzone领投。Riff提供AI应用开发平台,支持多行业,旨在提升商业效果和项目成功率,新资金将用于市场扩展。 总部位于奥斯陆的Riff(原名Databutt […]

发布时间:2025年10月23日
Meta裁减AI部门约600岗位,加速技术竞赛

Meta裁减AI部门约600岗位,加速技术竞赛

快速阅读: Meta Platforms 从超级智能实验室裁减约600个职位,以加速AI技术发展。AI首席Alexandr Wang通知裁员,旨在加快决策,增加员工责任。Meta继续为TBD实验室招聘,该团队聚集高薪AI人才。 据报道,Me […]

发布时间:2025年10月23日
渠道伙伴成企业AI转型关键,助力解决安全与数据挑战

渠道伙伴成企业AI转型关键,助力解决安全与数据挑战

快速阅读: Gartner预测,至2026年80%企业将部署生成式AI,但安全与数据基础设施挑战成障碍。研究显示,近半数企业因安全顾虑暂缓云迁移,超半数数据无备份,70%企业过去一年遭遇网络攻击,平均损失五周生产力。VARs在协助企业克服安 […]

发布时间:2025年10月23日
英政府推出AI工具,大幅提高咨询反馈分析效率

英政府推出AI工具,大幅提高咨询反馈分析效率

快速阅读: 英国政府宣布加速人工智能发展,采用“汉弗莱”系列中的Consult工具,每年可节省75,000个人工工作日,该工具处理50,000份咨询回复仅需2小时,效率远超人工。 英国政府宣布,将加速推进人工智能的发展。此前一项研究发现,每 […]

发布时间:2025年10月23日
IBM新Z17主机助力营收大增,AI成增长引擎

IBM新Z17主机助力营收大增,AI成增长引擎

快速阅读: IBM在生成式AI领域赢得95亿美元订单,大型机收入同比增长59%,新Z17机器贡献显著。AI基础设施增长15%,存储成为关键销售点。 克里希纳指出,IBM在生成式AI领域赢得了95亿美元的订单,这是一个显著的成绩。此外,IBM […]

发布时间:2025年10月23日
英特尔之后,消息称美国政府欲用联邦资金入股多家量子计算公司

英特尔之后,消息称美国政府欲用联邦资金入股多家量子计算公司

快速阅读: 特朗普政府正与多家量子计算公司谈判,拟通过联邦资金注资换取股权,涉及IonQ、Rigetti Computing等,每家获至少1000万美元。 感谢IT之家网友 小兴365 的线索投递! IT之家 10 月 23 日消息,据《华 […]

发布时间:2025年10月23日