企业需先治理数据再推进AI，避免业务受损

快速阅读: AI技术快速发展，但数据质量问题引起关注。专家指出，缺乏良好数据治理可能导致AI项目失败，强调数据治理重要性，建议企业谨慎采用AI，重视数据质量和治理，以实现长期竞争优势。

近年来，人工智能（AI）技术迅速发展，逐渐渗透到商业企业的各个领域。然而，在这股热潮中，数据质量是否被忽视了呢？我们采访了Komprise的联合创始人兼首席运营官Krishna Subramanian，探讨为何良好的数据治理对于成功实施AI至关重要。

问：为什么有人预测今年会出现AI失败？

答：围绕生成式和代理型AI的兴奋情绪促使了广泛的实验，但并非所有实验都负责任地进行。许多组织将这些工具接入混乱且管理不善的数据集，错误地认为更多的数据会自动带来更多的洞察。实际上，未经治理的数据往往包含不准确、偏见或敏感信息，可能引发声誉损害、合规违规或操作失败。当这些失败发生时，它们不会是小问题，而是高调、戏剧化且代价高昂，足以引发广泛的反思。这些事件将凸显许多IT领导者已经怀疑的问题：AI最大的风险不是模型本身，而是其底层数据。

问：这意味着我们将进入一个‘反AI’时代吗？

答：绝非如此。这不是对AI本身的反对，而是对草率AI的抵制。企业意识到，没有坚实保障措施的鲁莽采用是不可持续的。因此，CIO及其团队将重新校准战略：放慢脚步，更加严格地审查工具，并区分那些成熟、安全、受控的解决方案与那些不成熟且有风险的方案。换句话说，虽然炒作周期正在降温，但这项技术不会消失。真正结束的是那种认为可以不经过深入考虑就将AI附加到企业中的假设。

问：在这一重新校准过程中，数据治理将扮演什么角色？

答：专门针对AI的数据治理即将从‘可选’转变为‘必需’。多年来，治理框架主要围绕合规、归档和保留设计。但AI带来了新的挑战：如果数据标记错误、未分类或未管理，那么建立在其上的AI将继承并放大这些缺陷。即将到来的AI采用放缓更多是为了将治理嵌入每一个项目的核心，而不是减缓创新。这意味着CIO将实施系统审计、主动监控和实时警报，以确保AI系统不会滥用数据。这不仅是为了遵守法规，更是为了保护业务价值，防止灾难性的错误。

问：为什么非结构化数据在这个谜题中如此关键？

答：非结构化数据是AI采用中的‘房间里的大象’。据估计，企业数据中有70%至90%是非结构化的，例如电子邮件、聊天记录、PDF文件、设计文件、视频或物联网传感器数据流。由于这类数据杂乱无章且难以分类，历来被低估利用价值，但AI依赖它来提供上下文和洞察力。如果没有适当的分类、标签和准备，非结构化数据就会成为一种负担。敏感文件可能会在没有保护措施的情况下暴露给AI模型，或者无关、低质量的数据会稀释输出的准确性。IT领导者现在意识到，在释放AI之前，必须先驯服非结构化的扩展，引入自动化工具进行标签、分类和系统管理。

问：自动化如何支持AI数据治理？

答：数据量庞大以及AI实时消费和转换数据的速度需要内置智能和自动化。能够持续审计数据、检测异常并在实时触发警报的工具将成为现代治理的支柱。自动化确保了一致性，减少了人为错误，消除了瓶颈，使IT团队确信治理不仅是一次性事件，而是一种持续的保障。随着AI采用规模的扩大，自动化将是唯一能够以所需速度执行政策的方式。

问：除了技术风险，还有哪些更大的压力使得AI数据治理变得紧迫？

答：AI并非孤立存在。地缘政治不稳定、关税上升和供应链中断已经迫使组织更加审慎地思考数据存放的位置和谁可以访问这些数据。数据主权不再是合规的一个勾选项，而是动荡世界中的战略优势。

通过将治理嵌入人工智能项目，首席信息官可以更好地掌握数据的位置、跨境流动情况及在不同司法管辖区的安全性。在动荡的宏观经济环境下，这种知识直接转化为韧性。治理不仅是一种防御措施，还成为一种竞争优势。

预算限制如何影响人工智能的采用？

人工智能的成本很高，从采购合适的IT基础设施（存储和计算）来运行大型语言模型和托管AI工具，到AI软件订阅费用、治理平台、开发成本以及管理和准备数据的系统和流程。IBM的一项研究表明，大型公司计划将其收入的大约3%分配给AI，相当于一家10亿美元公司的年度支出约为3320万美元；而小中型企业可能将总收入的5%至20%用于AI，据Hubspot报道。

面对这样的数字，首席信息官没有无限实验的奢侈。成本优化将成为治理问题。能够以具有成本效益的方式扩展AI并采用提供灵活性、易用性和无锁定技术的组织将取得成功。有效管理数据，例如通过识别跨数据孤岛的趋势、去除不必要的和重复的数据，并将较少使用的数据存储在更便宜的存储介质上，是削减成本和为战略性的AI支出腾出空间的有效策略。

对于人工智能和数据治理的长期展望如何？

短期内的故事是评估和战略谨慎。但从长远来看，前景乐观。现在就着手于专门针对AI的数据治理的组织，未来将处于领先地位，拥有更安全、更具韧性和更符合业务重点的系统。

最终，治理不是阻碍AI创新的障碍，而是可持续增长的基础。通过控制非结构化数据的混乱局面、实现监督自动化和构建成本优化的主权系统，首席信息官可以将AI从一个由炒作驱动的风险转变为持久的竞争优势。

(以上内容均由Ai生成)