超越技术:建立印度主权 LLM 的基本要素是什么?
快速阅读: 《印度教商业线》消息,印度推进本土AI发展,授权萨尔瓦姆公司开发主权大语言模型,强调文化相关性和多语言支持。专家呼吁政策规范,确保模型公正、伦理且具地方特色,推动普惠AI。
即使萨尔瓦姆人工智能公司获得了从零开始构建主权大型语言模型的政府授权,人工智能领域的分析师仍希望该模型能够与当地文化和历史相关,并精通本土语言。
“现有的标准无法满足本地需求。它必须力争成为全球顶尖水平之一,”人工智能行业分析师卡什亚普·孔普拉告诉《商业线》。
“主权大型语言模型(LLM)必须足够优秀,以被私营部门优先选择,而不仅仅是政府或补贴用户。各国可以根据具体应用场景利用西方LLM和本地LLM,”他说。
上个周六,印度人工智能使命计划呼吁印度实体开发本土基础模型,最终筛选出班加罗尔的萨尔瓦姆人工智能公司,负责开发首个主权基础模型。
“从零开始构建印度的主权模型是实现印度自立的关键一步。该模型将熟练掌握印度语言,支持语音功能,具备推理能力,并为安全的大规模部署做好准备,”萨尔瓦姆人工智能公司在获得授权后表示。
上个周六,印度人工智能使命计划呼吁印度实体开发本土基础模型,最终筛选出班加罗尔的萨尔瓦姆人工智能公司,负责开发首个主权基础模型。
该公司在未来半年内将获得4000块图形处理器(GPU),用于构建拥有700亿参数的模型。
政策呼吁
曾任Tech Mahindra首席数字官、CogniSpark创始人维·斯里尼瓦萨·拉奥,这家提供代理人工智能咨询的公司,呼吁出台相关政策规范本土LLM。
“政府应出台规定。数据集需要针对文化、宗教、地区和语言敏感性进行审计。若数据集未经过审计,本土LLM生成带偏见的输出时可能引发问题,”他指出。
“所有州和地区都应被咨询,以了解其细微差别。应组建一个专门小组,负责伦理、负责任及可解释的人工智能,”他说。
卡什亚普大力倡导本土LLM,他认为西方训练的LLM常常缺少对非西方社会特有的语境、敏感性、传统、幽默及社会规范的理解。
“当地人口不擅长英语,且在本土语言上的LLM表现不佳限制了实用性并设置了进入壁垒。本地LLM能更好地理解并体现社会价值观、民间故事以及区域特色挑战,”他说。
“主要基于西方数据集训练的LLM强化了以西方为中心的世界观。本地LLM有助于从本地角度重新解读历史,而非透过西方学术视角筛选。”他补充道。
169Pi创始人拉吉特·阿里亚说:“专注印度的LLM需融合可扩展的人工智能与印度丰富的语言、文化和行业多样性。若以可访问性、伦理及领域针对性为核心设计,萨尔瓦姆人工智能的基础模型可以引领新的生成式人工智能浪潮,弥合而非加深数字鸿沟。创建真正的印度LLM不仅是训练更大模型,更是解决更大问题。印度人工智能未来的领导地位不在于复制硅谷模式,而在于构建深深扎根于印度、高度可扩展的人工智能生态体系。”
发表于2025年4月27日
(以上内容均由Ai生成)