“拥有自己的基础 AI 模型至关重要,因为我们的人口结构不同”
快速阅读: 据《印度教徒》称,DeepSeek虽是一次警钟,主要针对美国人。实际开发成本远超500万美元,且需大量GPU。他们通过分阶段处理和并行连接实现技术突破。印度也在采用类似方法,已有7-8家私营企业参与建设计算设施,总计约18,000个GPU。政府将购买这些设施用于AI模型开发。目前,数据集和计算设施的问题正在逐步解决。
当然,DeepSeek无疑是一次警钟,但可能更多是针对美国人而非我们。人们普遍认为仅用五百万美元就能开发出来是难以置信的,实际花费可能要多得多。最近的报道似乎证实了这一点,他们已经在某种其他背景下组装了大约一万五千至两万台GPU(图形处理单元)并正在使用它们。尽管如此,在使它们并行工作方面确实存在创新。
他们没有一次性处理完六千六百亿个参数,而是分阶段进行,并找到了在并行中连接它们的方法。这本身就是一种突破。我必须补充的是,其他人也在使用这种方法。这在印度也是如此。在我们的AI使命中,我们已经解决了若干问题。我们拥有计算资源,这一使命将开发必要的基础AI模型。你需要有数据中心来容纳所有这些计算设备。政府已向私营部门发出招标,以设立计算设施。政府将作为购买方。因此,计划中的计算能力已经达到约一万八千个GPU的计算能力。印度有七到八个私营部门正在建设这些计算设施。
要开发基础大型语言模型(LLM),你需要训练模型的数据集。没有计算设施,你如何训练模型?目前这些问题正在得到解决。
(以上内容均由Ai生成)