Sarvam AI 能否克服挑战,在 INDIAai 使命下建立印度第一个本土 LLM?

发布时间:2025年4月30日    来源:szf
Sarvam AI 能否克服挑战,在 INDIAai 使命下建立印度第一个本土 LLM?

快速阅读: 据《经济时报》称,总部位于班加罗尔的Salvam AI成为首个入选“印度人工智能使命计划”的初创企业,将获4096块NVIDIA H100 GPU支持开发本土大语言模型。该项目总投资12.5亿美元,目标是使印度成为全球AI领导者。然而,Salvam面临数据集整合、人才短缺和技术挑战等问题。

上周,总部位于班加罗尔的萨尔瓦姆人工智能公司成为首家被印度官方选中,在“印度人工智能使命计划”下开发本土基础大型语言模型的初创企业。据媒体报道,该公司是从超过400名申请者中脱颖而出的。

印度官方将向萨尔瓦姆分配来自入围公司如Jio、CtrlS、Yotta和塔塔通信的4,096块NVIDIA H100 GPU,这一合作为期六个月。“印度人工智能使命计划”于2024年3月宣布,总投资额为10,372千万卢比(约12.5亿美元),旨在推广人工智能创新和计算资源的普及,提升数据质量,并推动印度成为全球人工智能领域的强国。为此,政府开始投资建设一个高端且普遍可访问的计算设施,配备总计18,693个GPU。

值得注意的是,2022年联合国教科文组织发布的教育报告显示,印度在全球范围内拥有最高比例的人工智能技能渗透率。同时,2024年斯坦福大学的人工智能指数报告也显示,印度在人工智能的发展中处于世界领先地位。萨尔瓦姆作为印度人工智能使命计划的第一个参与者,承载着实现这些目标的重任。

印度方面认为,这款拥有700亿参数的主权模型将能够与全球顶尖模型竞争。萨尔瓦姆已确认,其能够进行复杂推理及以语音为主的交互,并能流利掌握包括英语在内的22种印度语言的模型将是安全的,预计将在六个月内部署至人口规模的应用场景。

然而,不可否认的是,完全在印度完成这款大型语言模型的训练与发展将会面临诸多挑战。语言巴别塔:获取并整理代表印度语言多样性的大型数据集,尤其是包含方言的部分,既困难又繁琐。非英语的印度语言有着各自复杂的语法、结构和句法。构建一个能够识别所有这些特征并且保持流畅的上下文模型并非易事,尤其是在与全球大型语言模型进行对比测试时。此外,还需要在国家复杂的社会规范背景下识别并消除性别、宗教、种姓等方面的偏见。

内容及其不满:数据清洗工作将耗费大量时间,版权和许可问题也可能带来困扰。能言善辩:印度虽然拥有庞大的劳动力队伍,但构建大型语言模型需要具有自然语言处理、机器学习以及复杂架构高级技能的研究人员、工程师和语言学家。在全球市场中,这类人才不仅稀缺还很难留住。最终的成功与否取决于能否激发研究人员、行业专家和开发人员的兴趣,基于萨尔瓦姆的模型开发应用和服务,从而促进广泛应用。

网络互联:与其他设备、应用程序和平台的互操作性同样是一项巨大挑战。同样地,适应不断发展的技术、架构和优化技术也是必不可少的。

基础不足:尽管印度对全球人工智能研究的贡献不到1.5%,高性能集中式计算资产尚不成熟,云计算基础设施刚刚趋于稳定,学术界正在追赶步伐,而人才库目前仍处于流动性状态,萨尔瓦姆依然需要创造奇迹。

数据赤字:印度已经加大了对人工智能的资金支持力度。现在它必须进一步努力弥补国家在数据方面的劣势。因为数据充足是人工智能发展的核心要素。印度人工智能使命计划的数据平台AIKosh刚刚上线。但这仅仅是由政府管理的一个起点。印度必须在遵守隐私和基于规则的规范框架内,访问像Jio、Airtel、MakeMyTrip、Zomato和PhonePe等实体所持有的大量多模态数据,以及锁定在卫生、教育、农业、金融、铁路和航空等部门中的海量数据。

合作:正式的政府间交流项目、与世界知名大学的合作以及其他双边和多边安排可以帮助印度缩小因起步较晚而产生的差距。根据咨询公司Zinnov的数据,跨国公司在印度建立了大约2,975个全球共享服务中心。这些中心是功能齐全的创新和研发中心,雇佣了190万名专业人士,2024年创造了650亿美元的收入——这是世界上任何其他国家都无法比拟的数字。这无疑是一个值得追求的目标。

(免责声明:本文中的观点仅代表作者个人观点。此处表述的事实和观点并不代表www.economictimes.com的观点。)

(以上内容均由Ai生成)

你可能还想读

SK海力士凭借HBM激增首次超越三星,领跑全球内存市场

SK海力士凭借HBM激增首次超越三星,领跑全球内存市场

快速阅读: 据《《韩国先驱报》》称,7月20日,SK海力士首登全球内存芯片市场榜首,受益于AI产品和HBM芯片领先地位。其季度利润达9.2万亿韩元,远超三星。 据韩联社报道,7月20日,韩国京畿道伊川,SK海力士首次登上全球内存芯片市场榜首 […]

发布时间:2025年8月1日
STAN 从谷歌、万代南梦宫和其他公司筹集了 850 万美元

STAN 从谷歌、万代南梦宫和其他公司筹集了 850 万美元

快速阅读: 据《印度教业务线》称,STAN获850万美元融资,由万代南梦宫等机构投资。计划拓展印度市场,加强AI功能与创作者工具。平台用户超2500万,专注移动端社交游戏。 记者获悉,8月1日,社交游戏平台STAN宣布完成850万美元的新一 […]

发布时间:2025年8月1日
“这改变了一切”:谷歌的人工智能模式迫使品牌重新考虑搜索策略

“这改变了一切”:谷歌的人工智能模式迫使品牌重新考虑搜索策略

快速阅读: 据《营销周》称,谷歌推出AI搜索模式,减少外部链接,提升对话式回答。品牌需调整策略,重视内容质量与品牌权威。此变化影响营销方式,竞争加剧。 据谷歌官方消息,7月29日,谷歌在英国推出了基于人工智能的搜索功能AI模式,此前该功能已 […]

发布时间:2025年8月1日
在 Android 上用更智能的应用程序替换 Google Assistant

在 Android 上用更智能的应用程序替换 Google Assistant

快速阅读: 据《电话竞技场》称,据报道,用户可从Google Play下载Meta AI应用,安装后需检查版本是否为230.0.0.36.164或更高。操作方法:进入设置,选择应用,查看Meta AI信息页底部的版本号。 据媒体报道,用户现 […]

发布时间:2025年8月1日
Xero 的英国董事总经理回击人工智能正在抢走会计工作的说法

Xero 的英国董事总经理回击人工智能正在抢走会计工作的说法

快速阅读: 据《UKTN(英国科技新闻)》称,英国科技媒体UKTN报道,Xero英国总经理凯特·海沃德表示,会计行业无需过度担忧AI自动化。尽管四大事务所裁员,但Xero仍持续投资AI技术,提升效率与服务质量。 据英国科技新闻网站UKTN报 […]

发布时间:2025年8月1日
Reddit 计划在搜索引擎市场大力推动人工智能与谷歌竞争:报告

Reddit 计划在搜索引擎市场大力推动人工智能与谷歌竞争:报告

快速阅读: 据《商业标准》称,Reddit CEO表示,公司正将平台转型为搜索引擎,整合AI功能,提升用户体验。Reddit Answers用户已超600万,计划全球推广。 据《The Verge》报道,7月11日,Reddit首席执行官史 […]

发布时间:2025年8月1日
Meta 超出预期,为“个人超级智能”做准备

Meta 超出预期,为“个人超级智能”做准备

快速阅读: 据《RCR无线》称,Meta二季度营收475.2亿美元,净利润183亿美元。CEO扎克伯格称将打造个人超级智能,但数据中心扩容遇挑战。公司计划2025年支出达1140-1180亿美元。 据媒体报道,7月25日,美国加州,社交媒体 […]

发布时间:2025年8月1日
人工智能将导致财富、权力的集中;必须使用人工智能来解决社会挑战:Nilekani

人工智能将导致财富、权力的集中;必须使用人工智能来解决社会挑战:Nilekani

快速阅读: 据《印度教业务线》称,印度联合创始人纳南·尼莱卡尼表示,AI应用于解决实际问题,提升医疗与教育,强调简约设计和持续创新,反对全民基本收入,主张用AI放大人类潜力。 据《亚洲时报》报道,7月27日,纽约,印度信息技术服务巨头Inf […]

发布时间:2025年8月1日