开放 AI 访问以解锁决策 [Q&A]
快速阅读: 据《Beta新闻》称,越来越多企业采用生成式人工智能,但数据质量问题、管理和访问限制等挑战阻碍了其价值实现。现代数据公司CEO斯鲁詹·阿库拉认为,通过改善数据质量和治理,以及利用人工智能辅助数据工程,可以释放更多价值。他强调,人工智能不会取代数据工程师,而是使其更专注于高价值活动。
2025年2月17日伊恩·巴克撰写越来越多的企业开始采用生成式人工智能,希望从其数据中获得更大价值。但治理问题、数据访问限制以及缺乏适当技能,这些因素可能导致项目停滞不前或未能达到预期效果。我们采访了现代数据公司首席执行官斯鲁詹·阿库拉,他指出,将人工智能交给非技术用户使用,可以实现“权力下放”并为企业创造实际价值。
本:为什么组织无法从人工智能中获得最佳价值?
萨:人工智能成功面临的最大障碍其实并不是人工智能本身的问题,而是数据质量和管理的问题。尽管公司竞相整合复杂的AI模型,但在企业规模上,它们却面临着“垃圾进,垃圾出”的经典问题。组织面临三个关键挑战,这些挑战阻碍了它们的AI投资产生实际价值:
首先,数据质量和上下文。人工智能需要干净、可信的数据,但大多数企业数据是原始且分散在多个来源中的。没有适当的上下文化和清洗,几乎不可能有效应用人工智能。其次,数据发现和可访问性。数据工程师大部分时间都花在寻找和格式化正确的数据上,而不是用它来创造价值。这导致了著名的“80/20法则”,即80%的时间用于数据工程任务,而不是进行实际建模和分析。最后,治理复杂性。组织难以在保护数据的同时充分利用数据。没有全面的知识图谱和适当的治理框架,很难确定AI模型应访问哪些数据以及如何保护这些数据。
本:更广泛地访问AI工具如何能带来好处?
萨:AI工具可以在整个组织内产生显著的放大效应。在现代数据公司,我们看到这种效应以多种方式展现出来:
我们使用机器学习和人工智能快速评估数据质量,理解数据特征,并识别分类模式。这有助于自动化那些原本需要手工完成的任务,比如在自由文本中识别个人身份信息(PII)。更重要的是,人工智能可以随着时间改进数据质量。它可以识别数据中的差距、不一致性和潜在改进领域。我们开发了人工智能驱动的角色,可以自动化例行数据工程任务,让团队能够专注于创造价值。我们使用机器学习和人工智能快速评估数据质量,理解数据特征,并识别分类模式。这有助于自动化那些原本需要手工完成的任务,比如在自由文本中识别个人身份信息(PII)。通过生成式人工智能,我们进一步实现了副驾驶功能,可以自动发现元数据并提供关于数据关系和使用模式的更深入洞察。我们使用机器学习和人工智能快速评估数据质量,理解数据特征,并识别分类模式。这有助于自动化那些原本需要手工完成的任务,比如在自由文本中识别个人身份信息(PII)。
本:企业拥有难以访问的孤岛数据难道不是问题吗?
萨:是的,这是问题之一。这依然是企业数据管理中最大的挑战之一。传统的做法,比如在电子表格中维护数据目录,已不再足够。解决方案需要三管齐下的方法:具备语义搜索能力的自动化数据目录创建;基于意图的发现系统,理解用户想完成什么;细粒度的访问控制,在保持安全的同时促进数据发现。借助现代数据操作系统,我们将此作为核心设计原则。我们的平台允许用户搜索任何他们需要的数据,同时通过基于策略的访问控制严格治理。当架构变化或添加新数据时,它会自动成为可发现的资产基础,同时在整个团队级别上维持适当的访问控制。
本:这样做在数据治理方面存在哪些风险,如何解决?
萨:数据的存在不应是一个秘密——重要的是控制谁可以访问它以及如何访问。这里的关键见解是数据可见性和数据访问是两回事。事实上,提高数据的可发现性同时保持严格的访问控制通常比将数据隐藏在孤岛中更能提高安全性。我们关注元数据治理而非完全的数据封锁。这使得组织能够了解现有数据及其访问权限,从而使得数据既更易于获取也更安全。这听起来可能有些矛盾,但实际上这种方法通过提供对数据资产的清晰可见性,并在严格控制访问的同时增强了数据的效用和保护。
萨:数据的存在不应是一个秘密——重要的是控制谁可以访问它以及如何访问。这里的关键见解是数据可见性和数据访问是两回事。事实上,提高数据的可发现性同时保持严格的访问控制通常比将数据隐藏在孤岛中更能提高安全性。
本:开放人工智能是否可以消除数据工程的需求,或者这个角色会演变?
萨:人工智能不会消除数据工程,正如它不会消除软件工程一样。相反,它将转变角色以专注于更高价值的活动。我们已经看到了这种演变:
数据工程师通过人工智能辅助获得了显著的生产率提升。他们不必重复构建基本管道或编写样板连接代码,而是可以利用人工智能助手处理常规任务,同时专注于战略工作。未来的数据工程师将更加注重通过数据创新来推动业务转型,而不是过多关注基础设施的维护。随着人工智能成为商业战略的核心,数据工程师将从管道构建者转变为业务转型的战略伙伴,专注于将数据转化为实际业务价值,而不仅仅是管理数据。数据工程师通过人工智能辅助获得了显著的生产率提升。他们不必重复构建基本管道或编写样板连接代码,而是可以利用人工智能助手处理常规任务,同时专注于战略工作。
图片归属:安德烈·波波夫 / depositphotos.com
分享推特钉住邮件短信
(以上内容均由Ai生成)