中国初创公司以新芯片框架挑战 Nvidia 的 AI 领先地位
快速阅读: 据《韩国时报》最新报道,中国清华团队开发的新AI框架“赤兔”,能在国产芯片上运行,挑战英伟达GPU dominance。此举旨在减少对英伟达的依赖,推动技术自主。多家中国企业正加强合作,以提升本土AI能力。
巴塞罗那,西班牙,3月5日。法新社-韩联社——参观者观看一个Nvidia全息投影。法新社-韩联社报道,由中国清华大学相关团队开发的新一代人工智能(AI)框架据称能够减少对英伟达芯片在AI模型推理中的依赖,这标志着中国增强技术自主能力的最新努力。
周五,由清华大学计算机科学教授翟继东领导的初创公司清城AI联合发布了声明,称面向大型语言模型的高性能推理框架“赤兔”可以在国产制造的芯片上运行,挑战了英伟达Hopper系列图形处理器(GPU)在支持某些模型如DeepSeek-R1方面的主导地位。
AI框架是复杂智能AI模型的基础构建模块,提供一系列库和工具,使开发者能够高效地设计、训练和验证复杂模型。据该公司称,自本周五起开源以来,“赤兔”框架支持主流模型,包括来自深寻和Meta平台的Llama系列。该公司表示,在使用英伟达A800 GPU测试DeepSeek-R1完整版本时,该框架实现了模型推理速度提升315%,同时将GPU使用量减少了50%,相比外国开源框架表现更优。
这一举措是中国AI公司减少对英伟达依赖的一部分,其高性能GPU受到美国出口管制。华盛顿禁止英伟达向中国客户销售其先进的H100和H800芯片。总部位于杭州的深寻以远低于西方同行的成本和计算资源开发其AI模型,也引发了对英伟达GPU需求可能下降的质疑。
深寻和英伟达的标志出现在这张插图中,1月27日。路透社-韩联社报道,清城AI由翟继东教授及其清华大学的学生于2023年创立,翟继东担任首席科学家。获得北京市人工智能产业基金支持,这家初创公司已与中国顶尖的GPU制造商合作,包括摩尔线程、炎黄和爱立维核心X。
其他中国科技公司在深寻势头的推动下也加强了减少对外部技术依赖的努力。今年2月,计算基础设施平台提供商Infinigence AI宣布正在促进国内七家领先AI芯片开发商的合作:碧仁科技、海光信息技术、摩尔线程、梅塔克斯、炎黄、爱立维核心X和华为技术Ascend。
字节跳动(TikTok母公司)的研究人员在最近的一篇研究论文中报告称,使用优化系统后,LLM训练效率提高了170%。该公司表示,新系统已经在字节跳动的一些生产环境中实施,实现“节省数百万个GPU小时”。
全文可在《南华早报》阅读。
(以上内容均由Ai生成)