中央政府选择初创公司 Sarvam 构建该国首个自主研发的 AI 模型

发布时间：2025年4月26日来源：szf

快速阅读: 据《印度快运》称，印度一公司将在政府支持下，未来六个月内获4000个GPU用于构建大型语言模型，预计不会开源但会针对印度语言微调。该模型参数达700亿，旨在提升战略自主性和国内创新，推动印度在AI领域的领导地位。

一位高级官员表示，在政府支持下，该公司在未来六个月内将获得4000个图形处理单元（GPU），用于构建和训练其模型。该模型预计不会开源，但会特别针对印度语言进行微调。这些GPU将由政府选定的公司提供给萨尔瓦姆（Sarvam），这些公司被选中在印度设立人工智能数据中心。

故事继续在此广告之下
此外阅读：我们不能仅仅成为AI的使用者，我们必须成为它的共同创造者。

“（萨尔瓦姆的）这个模型将拥有700亿个参数，并且在编程和工程方面有许多创新。凭借这些创新，一个700亿参数（模型）可以与世界上一些最好的模型竞争，”信息技术部长阿什温·瓦什纳夫说。

作为萨尔瓦姆大型语言模型提案的一部分，该公司正在开发三种模型变体：萨尔瓦姆-大型（Sarvam-Large）用于高级推理和生成，萨尔瓦姆-小型（Sarvam-Small）用于实时交互应用，萨尔瓦姆-边缘（Sarvam-Edge）用于紧凑型设备上的任务，萨尔瓦姆的联合创始人之一普拉蒂什·库马尔说。

这一发展正值深度求索（DeepSeek）——一款来自中国的低成本基础模型——对整个AI行业造成冲击之际。深度求索因其开源、准确性以及声称以远低于美国竞争对手的成本构建而进入AI领域，但由于其R1模型使用的GPU性能较差，导致英伟达的股票下跌。萨尔瓦姆的模型将在印度本土基础设施上构建、部署和优化，并由新一代印度人才开发。该公司在一份新闻稿中表示，这项计划旨在促进战略自主性、加速国内创新，并确保印度在人工智能领域的长期领导地位。

故事继续在此广告之下
此外阅读：谷歌-凯度研究显示，60%的印度人对AI不熟悉：Gemini全球用户达到3.5亿。

萨尔瓦姆的联合创始人维韦克·拉贾万说：“这是建立关键国家AI基础设施的重要一步。我们的目标是从头开始构建多模态、多尺度的基础模型。当我们这样做时，一个应用宇宙会展开。对于民众来说，这意味着与感觉更亲切而非陌生的AI互动。对于企业来说，这意味着挖掘智能潜力而无需将数据发送到国界之外。”

今年早些时候，政府还选定了10家公司提供18,693个高性能芯片——开发机器学习工具所需的高端芯片。这超过了印度AI使命最初的目标，即采购10,000个GPU。提供GPU服务的公司包括Jio平台、由希兰达尼集团支持的优塔（Yotta）、塔塔通讯、E2E网络、NxtGen数据中心、CMS计算机、Ctrl数据中心、洛库兹企业解决方案、东方技术、文斯科技术。

(以上内容均由Ai生成)