数据孤岛 — 为什么它们存在缺陷以及如何应对 [问答]
快速阅读: 《Beta新闻》消息,Nexla CEO指出,企业应接受数据孤岛存在,优先处理关键数据,采用数据产品策略和AI技术实现无缝访问。
据Nexla公司报道,7月11日,数据管理领域,首席执行官兼联合创始人萨克特·索拉布就数据孤岛问题接受了采访。索拉布指出,尽管企业投入巨资构建数据湖和现代数据仓库,试图实现数据的单一真相源,但这些努力往往难以达到预期效果。数据孤岛被视为影响效率、协作和数据驱动决策的主要障碍,但完全消除它们不仅过于雄心勃勃,而且可能因技术快速发展而变得无效。
索拉布解释说,新的数据孤岛生成速度远超企业集中它们的速度,当企业刚将数据以某种模式集中时,底层技术就已经发生变化。因此,企业应采取更务实的态度,接受数据孤岛的存在,并确保数据的无缝访问与使用。
在确定哪些数据孤岛是关键时,索拉布建议企业评估这些孤岛的目的、可用性和必要性,同时遵守数据引力原则,即数据会自然地根据其类型、功能或领域聚集。关键孤岛应支持特定团队的效率和决策,满足安全与合规需求,提升系统性能,并能够与其他系统无缝集成。
对于应优先去中心化的数据类型,索拉布强调了实时和操作数据、领域特定数据、协作和动态数据以及多格式或非结构化数据的重要性。这些数据对不同团队和用例具有高度相关性和灵活性,是企业中大量不同用户和应用的关键资源。
为了确保关键数据的无缝访问,索拉布推荐采用数据产品策略,而不是强行将所有数据放入中央系统。通过虚拟数据产品,企业可以实现实时跨孤岛访问,或者将高容量数据高效整合至云仓库或湖仓中。此外,AI技术在连接数据孤岛方面发挥着重要作用,但在此之前,必须对数据进行严格治理,确保其质量和安全性。
(以上内容均由Ai生成)