数据纠缠、人工智能和隐私：为什么法律还没有准备好

快速阅读: 据《安保大道》最新报道，数字世界的运行依赖于数据，人工智能（AI）成为信息处理的核心，推动了多种领域的进步。然而，AI的数据整合能力引发了隐私问题，尤其是在现有隐私法规局限于孤立数据集的情况下。公司通过服务协议限制数据使用，但AI的多级用途使得这些合同变得薄弱，导致潜在的隐私侵犯。法院已表示关注，新技术正改变我们对隐私的理解。

数字世界运行在数据之上。几乎在每一个行业中，人工智能（AI）如今已成为信息处理的核心，推动从预测分析到智能自动化等各个领域的发展。这种进步并非没有代价，尤其是对隐私的影响。如今的AI系统不仅限于自动化工作流程或总结数据。它们能够进行更深层次的操作：数据纠缠。这就是当AI从多个不同来源获取数据，整合这些数据并提取出任何单一数据集中无法显现的见解时所发生的情况。这种整合可能是自动化的，也可能是手动的。AI工具可能从你授权其访问的来源“拉取”数据，或者它可能会抓取所谓的“公开”来源的数据。通常，这些所谓的“公开”数据是在AI能力广为人知之前很久就已经存在的。例如，在米斯派上发布一张“公开”的照片（问问你的祖父母）并不意味着同意将该照片用于面部识别或AI深度伪造生成程序。当专为孤立数据集设计的隐私法规遇到通过整合所有数据而蓬勃发展的AI时，会怎样？数据整合使事情变得法律上复杂起来。隐私法规长期以来一直依赖于数据存在于孤立的“筒仓”中的想法，每个筒仓都有自己的保护措施，但AI打破了这些界限。当为孤立数据集构建的隐私法遇到通过整合所有数据而繁荣的AI时会发生什么？

大多数公司试图通过合同限制来管理数据使用情况，具体来说就是在服务协议或最终用户许可协议中明确规定允许和禁止的行为。这些合同条款对于简单的数据使用是有效的，但在人工智能应用中，这些合同限制开始变得薄弱。例如，一个服务协议可能允许人工智能工具处理客户反馈，但它可能没有明确规定当这些反馈被用于与客户服务无关的二次洞察时会发生什么。“质量保证”到底是什么意思呢？几年前，当人们拨打“411”寻求目录查询时，电话公司想出了一个好主意，对每次411呼叫收取一美元。然后谷歌推出了一个新的服务叫做“GOOG411”。你可以从你的手机拨打1-800-466-4411（Goog-411）来查询，比如在布朗克斯区的“萨尔比萨店”。这项服务会告诉你附近有三家“萨尔比萨店”，并免费提供连接到其中任何一家的服务。很酷。

当然，每当有人为你提供免费且有用的东西时，你并不是客户——你是产品。为了连接到萨尔比萨店，你告诉谷歌你的名字、电话号码和位置。你告诉他们你喜欢比萨，并且喜欢某种特定类型的比萨。你还告诉他们你喜欢下午4:45吃比萨——就在电台播出萨尔比萨广告之后（记得电台吗？）。你也告诉他们你愿意为萨尔比萨店走1.7英里，但不愿意走2.2英里。而且，由于数据纠缠，你还告诉他们除了喜欢比萨，你还喜欢洋基队棒球和白城堡汉堡（简而言之，你是布朗克斯人）。你可能还会分享其他一些个人背景信息——都是自愿的。有点吧。但你也在共享一个语音样本。所以谷歌可以收集你的声音，并将你的语音样本作为银行的身份验证系统出售。或者用它来训练语音识别软件程序。或者用它来生成一个你的AI双胞胎。简而言之，很难决定正在收集哪些数据以及为什么收集。即使谷歌不将收集的数据用于此目的，某些拥有该数据的人工智能程序也可能这样做。问题不仅仅是法律技术性的问题——它是实际操作中的问题。随着人工智能工具的发展，二级和三级用途变得不可避免，但大多数合同都未明确这些新兴用途如何符合原始权限授予。这种沉默留下了真空地带，可能导致用户面临意想不到的隐私侵犯和数据滥用。在数据纠缠的情况下，不仅难以在使用条款中明确数据处理的限制，而且几乎不可能确保这些限制在数据嵌入模型后得到遵守。法院在类似案件中已经暗示了类似的担忧，如卡彭特诉美国（2018年），法院认识到新技术从根本上改变了我们对隐私预期的理解。

(以上内容均由Ai生成)