Fractal Analytics 为印度第一个大型推理模型进行推介
快速阅读: 《经济时报》消息,总部位于孟买的Fractal Analytics提议投资118.8亿卢比打造印度首个大型推理模型(LRM),申请76.6亿卢比政府资金。该模型规模超OpenAI和DeepSeek R1,助力印度追赶AGI发展。同时,公司将发布多领域考试数据集以优化训练,推动AI主权与进步。
总部位于孟买的**人工智能公司Fractal Analytics**提出了一项总投资成本为**118.8亿卢比**的计划,旨在打造**印度首个大型推理模型(LRM)**。在向**印度人工智能任务(IndiaAI Mission)**提交的提案中,Fractal Analytics请求政府为其提供**76.6亿卢比**的外部资金。
拟议中的LRM系列将包括小型模型(**20-70亿参数**)、中型模型(**20-32亿参数**)以及先进的大型模型(**700亿参数,最多可训练1万亿令牌**)。对此消息,Fractal Analytics创始人**斯里坎特·韦拉马克尼**向《经济时报》确认,印度需要专注于能够“**思考和推理**”的后训练模型,而不是预训练模型。LRMs是一类专注于高级推理、问题解决和决策制定的大规模语言模型(LLMs)。
从规模上看,Fractal Analytics计划中的模型显著大于**OpenAI**的**o1**和**o3**推理模型。目前全球最大的推理模型是**DeepSeek R1**,拥有**6710亿参数**。
该拟议中的LRM可能帮助印度赶上**美国**和**中国**,并在全球范围内引领通向**通用人工智能(AGI)**的道路。韦拉马克尼表示:“预训练的时代已经结束。更好的AI竞赛现在集中在构建能够与预训练模型协同工作,并通过对复杂现实世界任务的更好规划和推理来实现目标的系统。”
Fractal Analytics计划基于开源大语言模型(包括宽松许可的许可证)开发推理能力,创始人解释道,这将涵盖整合印度本地大语言模型。
《经济时报》上周报道称,印度人工智能任务在第二轮于**3月15日截止**的竞标中收到了**120份**建设主权AI基础模型的申请。加上第一轮收到的**67份**提案,总申请数达到**187份**。一位高级政府官员告诉《经济时报》,电子信息技术部(MeitY)计划在本月底前批准至少几份申请。
此外,Fractal Analytics还计划创建并发布来自印度主要考试(如**JEE高级**、**NEET-PG**、**全国奥林匹克竞赛**、**CAT**、**GATE**等)的多样化数据集,以构建世界级的科学、技术、工程、数学(STEM)、编码、医学和代理系统推理模型。由于性能瓶颈和数据饱和,训练时间计算扩展正在面临回报递减的情况。因此,推理时间计算扩展是一种成本最优的方法,并为印度加速迈向AGI铺平了道路。
(以上内容均由Ai生成)