“拥有自己的基础 AI 模型至关重要，因为我们的人口结构不同”

发布时间：2025年3月10日来源：szf

快速阅读: 据《印度教徒》称，DeepSeek虽是一次警钟，主要针对美国人。实际开发成本远超500万美元，且需大量GPU。他们通过分阶段处理和并行连接实现技术突破。印度也在采用类似方法，已有7-8家私营企业参与建设计算设施，总计约18,000个GPU。政府将购买这些设施用于AI模型开发。目前，数据集和计算设施的问题正在逐步解决。

当然，DeepSeek无疑是一次警钟，但可能更多是针对美国人而非我们。人们普遍认为仅用五百万美元就能开发出来是难以置信的，实际花费可能要多得多。最近的报道似乎证实了这一点，他们已经在某种其他背景下组装了大约一万五千至两万台GPU（图形处理单元）并正在使用它们。尽管如此，在使它们并行工作方面确实存在创新。

他们没有一次性处理完六千六百亿个参数，而是分阶段进行，并找到了在并行中连接它们的方法。这本身就是一种突破。我必须补充的是，其他人也在使用这种方法。这在印度也是如此。在我们的AI使命中，我们已经解决了若干问题。我们拥有计算资源，这一使命将开发必要的基础AI模型。你需要有数据中心来容纳所有这些计算设备。政府已向私营部门发出招标，以设立计算设施。政府将作为购买方。因此，计划中的计算能力已经达到约一万八千个GPU的计算能力。印度有七到八个私营部门正在建设这些计算设施。

要开发基础大型语言模型（LLM），你需要训练模型的数据集。没有计算设施，你如何训练模型？目前这些问题正在得到解决。

(以上内容均由Ai生成)