DeepSeek 开源文件系统,声称它可以更快、更高效地运行 AI 模型
快速阅读: 据《技术点》称,近期,中国人工智能公司迪普西克启动了“开源周”活动,展示基于Linux的高性能文件系统——火飞者文件系统(3FS),用于内部AI训练和推理任务。3FS在无缓存读取情况下表现出色,可简化分布式应用部署。据初创公司视角人工智能评价,3FS可能革新大数据密集型工作。迪普西克还发布多个先进软件存储库,成本仅为英伟达DGX-A100服务器一半,性能却接近80%,能耗减少40%。这一举措旨在提高透明度和促进社区创新。
刚才发生了什么?西方组织称其“阴暗且不可信”,对此,迪普西克启动了“开源周”活动。在上周的活动中,该公司展示了基于Linux的文件系统,用于内部人工智能训练和推理任务。许多审查代码的人工智能专家对此印象深刻。上周,迪普西克在“开源周”活动中发布了五个最先进的软件存储库。这家中国人工智能公司展示了基于Linux的文件系统,用于内部人工智能训练和推理任务。火飞者文件系统(3FS)具有令人印象深刻的性能基准。西方人工智能公司已经开始注意并正在探索这些存储库。该公司设计了3FS以加速人工智能任务。这项技术利用现代固态存储单元和远程直接内存访问(RDMA)网络功能,提供共享存储层,简化分布式应用程序的部署。汤姆硬件指出,迪普西克的3FS代码在没有读取缓存的情况下工作,并优先处理随机读取请求,因为运行在GPU节点上的人工智能模型不断访问存储在服务器上的数据片段。该文件系统可以结合数千个SSD的吞吐量和数百个存储节点的网络带宽,简化应用代码并采用标准存储API模型。当在一个180节点集群中使用时,分布式文件系统可以达到6.6 TiB/s的聚合读取吞吐量,在灰色排序基准测试中(在25节点集群中)实现了3.66 TiB/分钟的吞吐量。初创公司视角人工智能称赞迪普西克的数据为一些“高级别”基准测试,描述3FS可能成为与人工智能、研究等相关的大数据密集型工作的潜在革命。在去年夏天发表的一篇论文中,迪普西克的研究人员描述了公司定制的火飞者2高性能计算架构的特点。由于3FS、海斯凯尔及其他软件堆栈组件,迪普西克在成本仅为英伟达DGX-A100服务器一半的情况下,达到了其80%的性能,并且能耗减少了40%。火飞者2配置了180个存储节点,每个节点配备16个16TB的SSD,两个200Gbps的NUC,以及10,000个通过PCIe连接的英伟达A100 GPU。
迪普西克创建“开源周”以强调其透明度和社区驱动的创新,之前被批评为神秘且不可信。这家中国公司作为开源存储库发布了许多软件产品,主要目标包括闪存MLA、深度EP、深度GEMM等。
(以上内容均由Ai生成)