用于全球协作的 Federated Learning Platform:保护跨境数据隐私

发布时间:2025年3月7日    来源:szf
用于全球协作的 Federated Learning Platform:保护跨境数据隐私

快速阅读: 据《所有技术杂志》称,联邦学习通过在保护隐私的同时进行多方模型训练,成为解决数据隐私问题的关键技术。该方法采用加法同态加密和差分隐私等技术,确保数据安全和模型质量。然而,国际合作仍面临数据异质性、信任与控制等问题,需建立标准化协议和去中心化治理模式,以促进全球范围内的联邦学习合作。

大型语言模型正在逐渐流行,并在零售、教育和交通等多个领域解决问题。世界正慢慢进入一个人工智能决策日益重要的时代,这使得机器学习模型、LLM模型及其他相关技术变得更加强大。但随着这一转变,市场对数据隐私问题的呼声也在增加。联邦学习可以在整个机器学习过程中保持敏感信息的机密性和安全性,这本身就是一个巨大的技术突破。允许多个参与方在不共享原始数据的情况下共同参与模型训练,这是联邦学习的一个显著优势。

挑战:隐私与数据主权

由于不同国家的数据共享法律限制,跨境合作受到严重制约。这使得企业和其他组织难以共同进行人工智能培训和发展。大多数国家开始制定重大立法,如GDPR作为法律示例。遵守这些隐私法规为寻求合作的外国机构创造了一张难以解读的限制网。如果不实施有用的隐私法规,全球规模的合作研究和快速创新将在合作层面受阻,从而成为一个问题。

联邦学习的解决方案

通过联邦学习,共享的机器学习系统解决了机器学习模型训练问题,允许多个参与方使用共享的机器学习模型,同时确保各方的隐私得到保护。而不是将数据上传到中央节点,每个网络参与者上传他们的模型,该模型将在本地数据集上进行训练。然后,每个参与者只向中央服务器或全局模型发送模型更新,如梯度或权重。这使得模型的安全训练成为可能,同时保护敏感数据。尽管联邦学习具有巨大优势,但仍有可能利用模型信息进行数据推断。由于模型更新被发送到中央服务器,它仍然可以保留一些关于用于训练模型的本地数据的残余信息。因此,必须添加进一步的隐私保护逻辑,以确保共享的模型更新不会泄露敏感信息。

门限同态加密作为一种增强安全性的方法。联邦学习采用“门限同态加密”技术,使用Paillier密码系统算法,允许保护数据隐私。通过数据加密,可以在不解密的情况下对数据执行特定操作。这种加密类型,“加法同态加密”,让中央服务器可以从原始数据中收集模型更新,而无需查看中间更新的明文。门限同态加密作为一种增强安全性的方法。此外,差分隐私和其他技术也可以增强隐私性。差分隐私通过让用户针对训练样本输出提出查询并引入随机噪声来解决保护训练集中选定个体隐私的问题。结合同态加密和差分隐私的特性,可以在完全了解加密形式的更新时,使某个秘密保持未知状态。

联邦学习工作流程

纳伦德拉·拉克什曼·戈达是一位平台工程和分布式系统的专家,对设计各种平台上的可扩展高效系统有深刻理解。在他的最新研究论文《联邦学习:跨国数据隐私下的协作机器学习》中,他解释了联邦学习系统的工作原理。被称为聚合器的中央服务器是主要协调者,确保来自各个机构的所有参与方都被关注。他们向参与方发送查询,每个参与方根据其本地数据集计算响应。每个参与者在其响应中添加一些噪声,然后使用给定的同态加密方案对其进行加密。这确保了差分隐私。另一方面,聚合器收集加密响应并执行加密聚合。然后,参与者接收部分解密的聚合结果,在这种情况下是模型权重。之后,参与者使用其私钥完成部分解密。所有响应部分解密后,聚合器将它们组合起来,创建最终的聚合结果。这个最终聚合结果是所有参与者共有的全局模型。该过程是迭代的,直到全局模型被精炼,这意味着模型已训练完毕,准备投入使用。

关键隐私和安全增强措施

为了保护用户数据在通过联邦学习(FL)训练改进AI模型时的隐私,实施了一些隐私和安全措施。差分隐私通过用随机噪声模糊个体更新,使其无法确定任何特定数据是否在训练集中使用。这意味着加法同态加密允许在敏感数据集上执行计算,而不会暴露数据。这意味着即使处理数据的系统也看不到内容,从而保持其安全。门限机制确保多个用户的数据保密,同时允许他们同时执行功能。随着更多参与者的加入,每个观察值都会添加噪声,防止敏感信息泄露,同时提升所考虑的AI模型的准确性。这些方法服务于不同的目的,从而在安全性和性能之间实现平衡,使AI模型能够在不使用过多敏感数据的情况下高效运行。

克服国际合作中的挑战

尽管许多国家愿意在最先进的机器学习方面进行合作,但全球模型总是受到数据异质性和通信开销的阻碍。通过联邦学习,尊重机器学习隐私变得更加容易,但在全球范围内工作会带来更多的问题:数据多样性:各国和其他参与者可能会以不同的方式收集数据,这反映在模型的整体质量和结构上。这可以通过旨在统一组件的数据整合方法来解决。信任与控制:一项比较研究确定了需要全面治理框架的需求,该框架集中管理知识产权权利的分配和消费以及其他敏感数据的跨区域管理。去中心化治理模式有助于解决这些问题,同时还能遵守当地政策并确保透明度。知识产权管理、数据权利和尊重隐私的治理政策的有效治理框架通常难以实现。本地和中央系统间的持续沟通也会大幅增加工作负担和其他开销问题。白皮书还提出了使用标准化协议、去中心化治理和激励模型作为最有效的途径,以在全球范围内进行跨境/机构的联邦教育合作。采用联邦全球学习协议将促进各国之间具有独特监管和技术要求的过程协议。FL教育倡议应由一个地方联盟监督,该联盟致力于促进参与者之间的合作,并确保遵守适用法律,例如国家课程中的法律。各国必须被鼓励平等贡献于全球模型,并奖励那些在合作努力中投入更多的国家。

白皮书还提出了使用标准化协议、去中心化治理和激励模型作为最有效的途径,以在全球范围内进行跨境/机构的联邦教育合作。

结论

本研究提出的混合联邦学习框架是迈向更广泛平台上更安全、更注重隐私的机器学习的重要一步。这是一个令人鼓舞且协作的发展。目标是通过利用同态加密和差分隐私等先进方法解决数据隐私问题并促进国际合作。此外,还有几种新的加密类型。联邦学习的集成增强了包容性、协作性和安全性的AI未来的可能性。

(以上内容均由Ai生成)

你可能还想读

本周科技大事件:谷歌发布Pixel 10,Gamescom揭晓重磅游戏

本周科技大事件:谷歌发布Pixel 10,Gamescom揭晓重磅游戏

快速阅读: 谷歌推出Pixel 10手机及Pixel Watch 4,新增卫星紧急通讯、可更换电池和屏幕、抬手通话等功能,屏幕亮度达3000尼特,还将与斯蒂芬·库里合作推出AI健康和健身教练服务。 谷歌本周在“由谷歌制造”活动中推出了Pix […]

发布时间:2025年8月23日
SK海力士凭借HBM激增首次超越三星,领跑全球内存市场

SK海力士凭借HBM激增首次超越三星,领跑全球内存市场

快速阅读: 据《《韩国先驱报》》称,7月20日,SK海力士首登全球内存芯片市场榜首,受益于AI产品和HBM芯片领先地位。其季度利润达9.2万亿韩元,远超三星。 据韩联社报道,7月20日,韩国京畿道伊川,SK海力士首次登上全球内存芯片市场榜首 […]

发布时间:2025年8月1日
STAN 从谷歌、万代南梦宫和其他公司筹集了 850 万美元

STAN 从谷歌、万代南梦宫和其他公司筹集了 850 万美元

快速阅读: 据《印度教业务线》称,STAN获850万美元融资,由万代南梦宫等机构投资。计划拓展印度市场,加强AI功能与创作者工具。平台用户超2500万,专注移动端社交游戏。 记者获悉,8月1日,社交游戏平台STAN宣布完成850万美元的新一 […]

发布时间:2025年8月1日
“这改变了一切”:谷歌的人工智能模式迫使品牌重新考虑搜索策略

“这改变了一切”:谷歌的人工智能模式迫使品牌重新考虑搜索策略

快速阅读: 据《营销周》称,谷歌推出AI搜索模式,减少外部链接,提升对话式回答。品牌需调整策略,重视内容质量与品牌权威。此变化影响营销方式,竞争加剧。 据谷歌官方消息,7月29日,谷歌在英国推出了基于人工智能的搜索功能AI模式,此前该功能已 […]

发布时间:2025年8月1日
在 Android 上用更智能的应用程序替换 Google Assistant

在 Android 上用更智能的应用程序替换 Google Assistant

快速阅读: 据《电话竞技场》称,据报道,用户可从Google Play下载Meta AI应用,安装后需检查版本是否为230.0.0.36.164或更高。操作方法:进入设置,选择应用,查看Meta AI信息页底部的版本号。 据媒体报道,用户现 […]

发布时间:2025年8月1日
Xero 的英国董事总经理回击人工智能正在抢走会计工作的说法

Xero 的英国董事总经理回击人工智能正在抢走会计工作的说法

快速阅读: 据《UKTN(英国科技新闻)》称,英国科技媒体UKTN报道,Xero英国总经理凯特·海沃德表示,会计行业无需过度担忧AI自动化。尽管四大事务所裁员,但Xero仍持续投资AI技术,提升效率与服务质量。 据英国科技新闻网站UKTN报 […]

发布时间:2025年8月1日
Reddit 计划在搜索引擎市场大力推动人工智能与谷歌竞争:报告

Reddit 计划在搜索引擎市场大力推动人工智能与谷歌竞争:报告

快速阅读: 据《商业标准》称,Reddit CEO表示,公司正将平台转型为搜索引擎,整合AI功能,提升用户体验。Reddit Answers用户已超600万,计划全球推广。 据《The Verge》报道,7月11日,Reddit首席执行官史 […]

发布时间:2025年8月1日
Meta 超出预期,为“个人超级智能”做准备

Meta 超出预期,为“个人超级智能”做准备

快速阅读: 据《RCR无线》称,Meta二季度营收475.2亿美元,净利润183亿美元。CEO扎克伯格称将打造个人超级智能,但数据中心扩容遇挑战。公司计划2025年支出达1140-1180亿美元。 据媒体报道,7月25日,美国加州,社交媒体 […]

发布时间:2025年8月1日