为用于训练 AI 的数据带来透明度
快速阅读: 据《麻省理工学院斯隆管理学院》最新报道,一个由多学科专家组成的团队,包括麻省理工学院的桑迪·彭特兰教授,发起了一项数据溯源倡议,旨在应对数据透明度的挑战。他们对用于训练大型语言模型的数据集进行了大规模审核,并追踪其来源和应用过程。该团队还撰写了一篇相关论文,开发了一个用户友好的工具,可生成数据集的创建者、来源和许可信息等概要,以提高人工智能训练数据的透明度和规范使用。
一支由多学科研究人员组成的团队,包括麻省理工学院的桑迪·彭特兰教授和其他成员,发起了数据溯源倡议,以直接应对数据透明度挑战。这些专家集体对用于训练公共和专有大型语言模型的海量数据集进行了大规模审核,从数据源到创建过程再到应用场景进行追踪和记录。该团队还撰写了关于该项目的论文,并开发了一款用户友好的工具,可以生成数据集的创建者、来源、许可信息和允许用途的概要。他们的目标是提高人工智能训练数据的透明度、文档记录和知情使用。
(以上内容均由Ai生成)