隐私保护视角下联邦学习的「前世今生」

本文探讨了联邦学习(Federated Learning)的发展历程,从工程实践和密码学技术的角度梳理了其起源和演变。联邦学习旨在在隐私保护的前提下实现数据智能融合,它与隐私保护计算(Privacy Preserving Data Mining, PPDM)和隐私保护机器学习(Privacy Preserving Machine Learning, PPML)有着深厚的联系。文章指出,联邦学习可以视为PPDM和PPML在当前数据隐私保护环境下的新形态,但也面临如何充分发掘已有技术优势的挑战。" 132283562,19694672,OpenCvSharp模板匹配带掩码的C#实践,"['计算机视觉', 'C#编程', 'OpenCvSharp', '图像处理', '模板匹配']

联邦学习(Federated Learning)作为人工智能的一个新分支,为机器学习的新时代打开了大门。自发展以来,其定义早已超过了早期提出范围,以至于现在只要出于隐私保护目的的多方机器学习都将其归属于「联邦学习」这一范畴。也有人对「联邦学习」这一名称提出异议,本文从实际应用的角度重新梳理了「联邦学习」的前世今生,希望能为读者提供一个新的联邦学习研究视角。

联邦学习的发展脉络

目前,国内对联邦学习(Federated Learning,简称FL)的发展脉络一般从两个视角进行梳理:

一是从联邦学习的工程落地时间线进行研究;二是从联邦学习中采用的技术发展时间线进行研究。

一般而言,前者认为联邦学习概念始于2016年由谷歌首次提出[1],并于2018年使用联邦学习平台训练递归神经网络(RNN)用于智能手机虚拟键盘下一词预测[2]。随后国内引入联邦学习概念,并将其系统归纳为横向联邦学习、纵向联邦学习、迁移学习、混合联邦学习等,与此同时出现了FATE、Angel PowerFL、PaddelFL、InsightOne等工业级应用产品。

该发展脉络以各企业的产品应用落地为时间节点,适合初学者了解联邦学习的基础概念、主体架构和发展状况。但由于其发展年限较短,且范围较窄,不太适合算法研究者以此脉络进行原理学习和算法创新。

图片

谷歌联邦学习平台训练神经网络

另一条时间线梳理了联邦学习中关键技术(如同态加密、多方安全计算)的发展:从1978年非对称加密RSA的出现[3]和同态加密概念的首次提出[4],到半同态加密系统的落地(如pallier[5])及2009年实现的首个全同态加密算法[6],现如今更是有各式各样同态加密的算法库可供选择(HElib[7]、SEAL[8])。

同时多方安全计算涉及的技术细节就更加丰富了,开始于1982年姚期智教授提出的百万富翁问题,涉及了秘密共享(SS)、混淆电路(GC)、不经意传输(OT)等多种安全计算协议,这里就不再详细展开。

这些技术最终与机器学习相结合,产生了联邦学习的概念。由此可见,这一脉络涉及了密码学领域的方方面面,需要研究者有很好的数学和密码学基础,进行深入的研究。

联邦学习与隐私保护计算

在数据隐私安全保护和破解数据孤岛双重需求的背景下,联邦学习应时而生,为实现「数据可用不可见」,解决企业间数据智能融合建模提供解决方案。

这里涉及到两个关键词:隐私保护和价值挖掘。实际上,在学术界,这两者的结合有一个专业名词,即隐私保护下的数据挖掘(Privacy

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

洞见科技InsightOne

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值