中央政府选择初创公司 Sarvam 构建该国首个自主研发的 AI 模型
快速阅读: 据《印度快运》称,印度一公司将在政府支持下,未来六个月内获4000个GPU用于构建大型语言模型,预计不会开源但会针对印度语言微调。该模型参数达700亿,旨在提升战略自主性和国内创新,推动印度在AI领域的领导地位。
一位高级官员表示,在政府支持下,该公司在未来六个月内将获得4000个图形处理单元(GPU),用于构建和训练其模型。该模型预计不会开源,但会特别针对印度语言进行微调。这些GPU将由政府选定的公司提供给萨尔瓦姆(Sarvam),这些公司被选中在印度设立人工智能数据中心。
故事继续在此广告之下
此外阅读:我们不能仅仅成为AI的使用者,我们必须成为它的共同创造者。
“(萨尔瓦姆的)这个模型将拥有700亿个参数,并且在编程和工程方面有许多创新。凭借这些创新,一个700亿参数(模型)可以与世界上一些最好的模型竞争,”信息技术部长阿什温·瓦什纳夫说。
作为萨尔瓦姆大型语言模型提案的一部分,该公司正在开发三种模型变体:萨尔瓦姆-大型(Sarvam-Large)用于高级推理和生成,萨尔瓦姆-小型(Sarvam-Small)用于实时交互应用,萨尔瓦姆-边缘(Sarvam-Edge)用于紧凑型设备上的任务,萨尔瓦姆的联合创始人之一普拉蒂什·库马尔说。
这一发展正值深度求索(DeepSeek)——一款来自中国的低成本基础模型——对整个AI行业造成冲击之际。深度求索因其开源、准确性以及声称以远低于美国竞争对手的成本构建而进入AI领域,但由于其R1模型使用的GPU性能较差,导致英伟达的股票下跌。萨尔瓦姆的模型将在印度本土基础设施上构建、部署和优化,并由新一代印度人才开发。该公司在一份新闻稿中表示,这项计划旨在促进战略自主性、加速国内创新,并确保印度在人工智能领域的长期领导地位。
故事继续在此广告之下
此外阅读:谷歌-凯度研究显示,60%的印度人对AI不熟悉:Gemini全球用户达到3.5亿。
萨尔瓦姆的联合创始人维韦克·拉贾万说:“这是建立关键国家AI基础设施的重要一步。我们的目标是从头开始构建多模态、多尺度的基础模型。当我们这样做时,一个应用宇宙会展开。对于民众来说,这意味着与感觉更亲切而非陌生的AI互动。对于企业来说,这意味着挖掘智能潜力而无需将数据发送到国界之外。”
今年早些时候,政府还选定了10家公司提供18,693个高性能芯片——开发机器学习工具所需的高端芯片。这超过了印度AI使命最初的目标,即采购10,000个GPU。提供GPU服务的公司包括Jio平台、由希兰达尼集团支持的优塔(Yotta)、塔塔通讯、E2E网络、NxtGen数据中心、CMS计算机、Ctrl数据中心、洛库兹企业解决方案、东方技术、文斯科技术。
(以上内容均由Ai生成)