Sarvam AI 的强烈反对暴露了印度 AI 的悲惨状况
快速阅读: 《印度分析杂志》消息,印度知名AI初创公司萨尔瓦姆AI推出的大型语言模型萨尔瓦姆-M因下载量冷淡遭批评,但其在印地语等方面表现获认可。尽管面临质疑,支持者认为其对印度本地需求的关注值得肯定,强调创新不应仅以即时影响力衡量。
当印度最知名的AI初创公司萨尔瓦姆AI(Axonwise Pvt Ltd)发布其最新大型语言模型(LLM)时,引发了关于该公司方法及其面临的更广泛挑战的讨论。作为首批被选中参与印度AI使命以构建印度主权基础大语言模型的公司之一,萨尔瓦姆AI最近推出了萨尔瓦姆-M,这是一个基于Mistral Small构建的具有240亿参数的开源混合型语言模型。对于印度AI研究人员而言,这是一项重大突破,该模型支持包括印地语、孟加拉语、古吉拉特语、卡纳达语和马拉雅拉姆语在内的十种印度语言。
然而,该模型在两天内在Hugging Face上仅获得334次下载,这一冷淡的反响招致了一些批评。Menlo Ventures的投资人德迪·达斯(Deedy Das)称其为“令人尴尬”,并表示没有真正的受众对这类渐进式工作表现出兴趣。他的评论引发了印度人工智能社区的热烈讨论。达斯还将此与由两名韩国大学生开发的一个开源模型进行了对比,后者获得了约20万次下载。尽管萨尔瓦姆声称致力于构建基础模型,并且还有更多版本即将发布,但这款早期发布的萨尔瓦姆-M,基于法国AI模型,引起了人们的关注。萨尔瓦姆并非孤例。由政府支持的BharatGen Param-1模型,在上周上线AIKosh时,仅收到12次下载。批评是否有道理?他进一步指出,谷歌和TWO.ai制作的更廉价且性能更优的模型在这几种语言中的表现都更好。“我并不反对萨尔瓦姆,我只是认为他们目前的贡献与其资金不成比例。”他补充道。根据公司数据,它已从Lightspeed India Partners、Peak XV Partners、Lightspeed Venture Partners和Khosla Ventures等领先投资者那里筹集了4100万美元。据Tracxn统计,截至2025年3月,其估值为1.11亿美元。
尽管如此,X上的几位用户指出,该模型很好且有多种用途,但也需要改进。虽然对萨尔瓦姆的Bulbul TTS模型表示赞赏,但持保留态度的达斯建议萨尔瓦姆应借鉴中国的DeepSeek,对其硬件和软件堆栈进行根本性的重新思考。他说:“专注于大规模的Indic和其他通用模型数据收集,这是推动前沿模型发展的关键。”
尽管如此,根据一份技术报告,萨尔瓦姆-M在性能上超过了Llama-4 Scout,并且在面对更大的模型如Llama-3.3 70B和Gemma 3 27B时仍能保持竞争力。报告显示,“我们发现基础Mistral Small模型在印地语方面可以得到显著提升。”不过,在英语知识评估如MMLU方面,它下降了1%。此外,萨尔瓦姆AI的阿沙伊·萨切达(Aashay Sachdeva)在X上为该模型辩护,称萨尔瓦姆-M为印地语创造了新的基准,并引导读者查看详细描述定制化和微调过程的技术博客。萨切达还在X上发布了一个Google表格,其中他用萨尔瓦姆-M的Think模型解决了七个来自2025年JEE高级考试的印地语问题,并全部正确回答。显然,该模型适用于多种用途。
同意不同意?许多人赞赏萨尔瓦姆的努力,并强调创新并不总是关于即时的病毒式传播。然而,有人认为这都是关于期望的不匹配以及印度对本土AI的押注是否能带来配得上期待的结果。大部分批评来自于将萨尔瓦姆与OpenAI或DeepSeek进行比较,而该公司试图解决的问题本质上是不同的。萨尔瓦姆AI的哈维恩·辛格·昌达(Harveen Singh Chadha)也在今年早些时候Krutrim推出其LLM时表达了批评意见,他说人们在未实际测试模型的情况下就对其进行批评。
在AI4Bharat工作的用户@cneuralnetwork通过关注方法论来捍卫萨尔瓦姆的工作:“模型本身并非重点——他们制作模型的方法才是我最喜欢的部分。它为其他开发者提供了后训练的方法并可能取得更好成果的基础。”有些人甚至分享了人们在Google Colab上使用萨尔瓦姆新发布的模型的例子,并列出了该模型可能帮助农民和法律界的潜在用途,集中在解决Bharat的需求上。
与此同时,萨尔瓦姆AI的机器学习工程师库莱因·贝诺伊(Kurain Benoy)表达了更广泛的乐观情绪和民族自豪感。另一方面,Reliance Jio的副总裁兼首席AI科学家高拉夫·阿加瓦尔(Gaurav Aggarwal)质疑围绕萨尔瓦姆的民族主义,指出它是由西方投资者资助的。
同时阅读:萨尔瓦姆2B对印度AI开发者来说足够好吗?印度Indic AI研究的悲惨状态
印度有6亿智能手机用户,相当多的人群偏好使用Indic键盘。例如,由CoRover.ai为IRCTC网站构建的AskDisha AI聊天机器人,用于预订印地语票务,就是一个经典案例。AI4Bharat的IndicTrans2等模型是为Bharat的大规模人口设计的。强调为Bharat构建人工智能的需求在过去已被多次提及。许多印度初创企业和研究人员旨在解决Bharat的需求,萨尔瓦姆需要突出其目标的应用场景。
Together Fund的合伙人普拉蒂什·乔杜里(Pratyush Choudhury)解释说,大多数印度以外的人不了解这些挑战,也不明白计算能力是相当大的无形障碍。这表明了创建Indic AI模型的重要性,这一趋势始于两年前,当时开发者开始基于Llama构建像卡纳达语、泰米尔语和马拉雅拉姆语等语言的模型。
谷歌的高级研究科学家拉杰·达布雷(Raj Dabre)和IndicTrans2的创作者之一说:“在萨尔瓦姆M发布之前,人们抱怨缺乏IndicLLMs。在萨尔瓦姆M发布之后,人们仍在抱怨。”尽管萨尔瓦姆在印地语方面的努力比另一家包装型初创企业更重要,但围绕萨尔瓦姆的争论,仅仅基于下载量来看,表明发展社区忽视了‘为印度打造’的理念。
(以上内容均由Ai生成)