AI 的隐性成本:数据准备会超出您的预算吗?
快速阅读: 《信息周刊》消息,为应对2024年人工智能热潮,数据准备成为关键挑战。Salesforce报告显示,预算中用于数据管理的比例远高于人工智能。专家建议采用数据网格或织物架构,强调根据企业需求选择合适方案及良好数据治理的重要性。
在2024年的众多大型科技会议和活动中,实施人工智能成为一个热门话题,因为信息技术领导者被赋予了为商业开发下一代人工智能工具的责任。然而,一个反复提及的问题是如何为机器学习准备数据。对清洁数据的需求可能会拖慢人工智能的推出进程并增加成本。最近,Salesforce的一份报告显示,首席信息官们将其预算的中位数20%用于数据基础设施和管理,而仅5%用于人工智能。缺乏可信的数据在首席信息官的主要人工智能担忧中占据重要地位。在另一份报告中,研究公司国际数据公司(IDC)表示,到2028年,全球在人工智能上的支出将达到6320亿美元。两年前,当OpenAI的ChatGPT迅速启动了生成式人工智能军备竞赛时,整个行业措手不及——许多公司不得不在满足数据需求的同时让这些数据达到人工智能就绪状态。
在数据准备上的支出可能是人工智能的一项显著初期投入成本,这取决于不同企业和组织的规模和成熟度。为人工智能准备数据是一项复杂且可能代价高昂的任务。信息技术领导者必须考虑多个因素,包括数据质量、数量、复杂性,以及为数据收集、清洗、标注和转换适合人工智能模型的成本做好准备。当这些需求叠加到新硬件、软件和与生成式人工智能采用相关的劳动力成本之上时,账单会迅速累积。
相关:突破人工智能瓶颈
首席信息官和其他技术领导者面临着将人工智能作为潜在价值创造者和可能的收入来源的任务。但许多公司在新的生成式人工智能项目上面临投资回报率的挑战,准备数据的时间和成本往往不会立即带来回报。花钱在数据上以用人工智能赚钱
麻省理工学院信息系统研究中心(MIT CISR)的作者兼首席研究科学家芭芭拉·维克斯姆说,领导者可以指出其他公司更成熟的AI部署的具体成功案例。她说,这些公司通过前瞻性的治理建立了强大的数据价值。“人工智能不应被视为独立的人工智能,而是数据价值创造或数据实现的一部分,”她在电话采访中告诉《信息周刊》。“我称之为数据货币化……将数据转化为金钱。如果组织和特别是领导者始终从这个角度来看待人工智能,你将不会有麻烦……如果一个组织试图减少其成本结构的一定百分比,或者试图以某种方式增加销售额或服务增长——无论目标是什么——那通常都是大笔资金。即使你对人工智能有非凡的投资,结果也可能大得多。”
相关:人工智能如何改变音乐行业
面对宏观经济困境,技术预算正在收紧,IT领导者需要说服C-suite中的非技术人员数据准备是一项值得的投资。维克斯姆指出了金融服务行业的一些成功案例,在那里IT领导者在其执行团队中具有很强的信誉。她说,其中一位领导者使用内部咨询小组积累了用例,向高管们提出了一份更传统的商业计划。“他们制定了四年内如何扩展的路线图——他们能够完成这一点,”维克斯姆说。但其他组织可能不像主要金融机构那样在数据治理方面成熟。在这种情况下,逐步的自下而上的方法也可以有效。“你不必一开始就设想所有要做的事情……但通过采取逐步的方法来建立能力,在过程中学习并建立不是孤岛而是不断增长的企业资源。”
下一步:找到与你的AI目标相一致的正确架构。数据网格和数据织物是两种竞争激烈的现代数据架构前沿,它们相似但有关键区别。
相关:为什么AI模型管理如此重要
网格还是织物?现代数据架构
在生成式人工智能时代之前,数据治理相对简单。许多公司将数据汇集到“数据湖”中,存储大量原始数据。对于人工智能应用,这种通用架构可能会造成生产效率低下的瓶颈。数据织物和数据网格架构在生成式人工智能实施方面正成为新的行业标准。这是因为这些现代架构将来自多个来源的数据整合成统一视图,简化数据维护并减少时间和成本。
数据网格:使用数据网格架构可以是一个不错的选择,可以让不同的业务部门拥有数据所有权。
数据织物:数据织物提供集中式架构,整合组织内的数据。这种方法允许统一的数据结构和中央治理。但这些新架构也有代价。较高的初始成本和持续的维护费用可能对一些企业构成重大进入障碍,具体取决于数据治理的规模和当前状态。数据网格可能会有更高的前期成本。数据织物的实施成本较低,但维护成本可能会更高。因此,专家表示,了解潜在的用例以证明支出的合理性,并了解哪种架构适合你的组织是很重要的。
数据织物公司Illumex的首席执行官兼创始人伊娜·托卡列夫·塞拉指出了可以从现代数据架构中受益的具体用例。她说,那些可以从数据织物中受益最大的组织包括那些“希望创建一定程度的自动化,业务用户自助访问数据分析,工作流自动化和过程自动化”的组织。她说,那些需要使用数据来构建分析并与他人协作的分散团队可以从数据织物架构中受益。“数据织物和数据网格就像宿敌又似朋友,”数据公司Stardog的联合创始人兼首席执行官肯德尔·克拉克说。“它们非常相似以至于没有人能分辨它们,但正是这些小差异。”由于数据织物非常相似,克拉克说客户会要求数据织物,但他们真正描述的是数据网格架构。因此,更重要的是对企业的独特数据需求有深刻理解。“标签并不那么重要。”
从哪里开始?找到“集结点”
“你不需要做出正确的决定,只需要选择,”克拉克在为生成式人工智能实施选择新数据架构时说。“我会先选择一个极其重要、对公司影响重大的问题。一些能让公司节省更多钱、管理风险、赚更多钱、提高生产力的事情——这些都是推动业务发展的关键。你需要选择一个作为你的集结点。”
无论你的起点是什么,成功的数据架构转换都需要干净且治理良好的数据,MIT CISR的维克斯姆认为。“不管是数据网格还是数据织物,只要我们按照应有的方式实践……例如,使用好的元数据,突然之间,你就有了互操作性,因为你有一致性和标准。问题是,大多数组织都是各自为政且杂乱无章——他们一开始就没有遵循教科书规则,所以他们处于补救模式。”
(以上内容均由Ai生成)