Capital One 推出数据标记化
快速阅读: 《计算机周刊》消息,花旗银行通过其软件Databolt扩展数据标记化应用,支持Databricks和Snowflake平台,提升数据安全。此工具能保护AI模型训练数据及个人信息,符合隐私法规,且保留数据格式便于整合。客户可在数据存储处直接标记敏感信息,增强安全性同时促进创新。
花旗银行的软件部门扩展了这款工具的应用范围,使IT部门能够借助数据标记化技术提升数据安全性。这家金融服务公司的企业级软件部门已在两大主要数据平台——Databricks和Snowflake上提供数据标记化软件Databolt。花旗银行将其实现数据标记化的做法描述为用数字表示取代原始数据的过程。在一篇介绍这项技术优势的博文里,公司表示:“在数据安全领域,标记化用随机生成的非敏感替代品(称为标记)取代敏感数据,这些标记无法关联到原始数据。”其应用场景包括使用数据标记化保护企业在训练人工智能模型时使用的公司数据,以及保护个人身份信息,以遵守如《通用数据保护条例》(GDPR)等数据保护法规,以及适用于电子商务交易的支付卡行业数据安全标准(PCI DSS)。标记化被视为一种替代加密的方法,但通常更容易整合到现有的IT系统中。它有效赋予了网络安全负责人从IT系统中移除敏感数据的能力,从而减少因IT安全漏洞导致的数据丢失影响。这是金融服务中保护支付数据的一项关键技术。根据花旗银行的说法,其中一项好处是标记化保留了数据的长度和格式。数据标记化还能维持数据库关系。这意味着它可以在现有的IT系统和应用程序中实现而不破坏它们处理数据的方式。麦肯锡的分析显示,到2030年,标记化的市场资本总额可能达到约2万亿美元,这主要得益于金融资产的标记化。标记化也是大型语言模型工作原理中的一个基本部分,它用于将单词和句子转换为可以处理的数值。
花旗银行表示,通过Databolt实现数据标记化,使公司能够在Databricks和Snowflake中直接标记敏感数据,从而让公司在数据存储位置更容易保护敏感数据。根据花旗银行的说法,这意味着IT安全负责人可以在不阻碍创新的情况下强化数据安全。花旗银行软件的高级副总裁兼首席产品和技术官德西坎·马赫瓦努尔表示:“当今的企业正在管理一个庞大的数据生态系统。将Databolt与Databricks和Snowflake集成是帮助企业在数据存储位置保护数据的关键,这样他们可以有信心构建应用程序并部署人工智能模型,同时确保数据得到保护。”
Databolt通过Databricks Unity Catalog提供数据标记化。花旗银行称,这种集成允许Databolt客户定义标记化策略,导入Databricks用户组以实现基于角色的访问控制,启动标记化任务并配置工作流程。它也可以在Snowflake Marketplace上获取。在这里,Databolt利用Snowpark容器服务和Snowflake原生应用框架与数据平台提供本地集成。根据花旗银行的说法,这种集成意味着敏感数据无需离开客户的Snowflake环境。花旗银行表示,在Snowflake平台上集成Databolt允许客户在其Snowflake环境中直接部署标记化引擎,根据预设的Snowflake角色定义标记化访问权限,并通过用户自定义功能访问标记化功能。
(以上内容均由Ai生成)