解说 |AIKosha:印度制造 LLM 的基石
快速阅读: 《财经快报》消息,AIKosha是一个提供印度特定匿名和非个人数据集的平台,涵盖政府机构和私营实体的数据,用于构建大型语言模型和人工智能应用。目前,该平台包括12家组织的13个领域,共315个数据集和84个模型。数据集和模型具有不同的访问权限,包括开放、受限和私人数据集。
AIKosha是一个提供印度特定匿名和非个人数据集的平台,这些数据集、模型和用例对于构建大型语言模型(LLM)和人工智能应用至关重要。这些数据集和模型来自印度医学研究理事会等政府机构以及Bhashini等经过验证的私营实体,如Sarvam和Ola Krutrim等在该平台上列出其印度语模型的初创公司。人工智能公司可以使用这些多语言语言模型进行翻译等应用。目前,它涵盖了12家组织的13个领域,共有315个数据集和84个模型。数据集包括2011年人口普查中各村庄的几何图形、航空投诉数据集及AirSewa平台上的其他数据、Bhashini语音翻译、土壤湿度的每日数据等。AIKosha中的每个数据集、模型或其他资源都有特定的权限设置——开放数据集、受限数据集和私有数据集,以定义使用权。受限数据集对平台上的所有用户可见,但需经数据所有者明确批准后方可下载。
(以上内容均由Ai生成)