基于空中计算的联邦学习快速模型聚合技术解析
1. 联邦学习与空中计算背景
随着人工智能和大数据分析的发展,数据的重要性日益凸显,被视为一种新型生产要素。同时,全球对用户隐私和数据安全的重视程度不断提高,各国纷纷出台严格的法规来保护数据隐私,如欧盟的《通用数据保护条例》(GDPR)和中国的《个人信息安全规范》。这使得设计具有数据隐私和安全保护功能的人工智能系统和算法成为全球性的重大挑战。
联邦学习作为一个新兴的前沿领域,引起了工业界和学术界的广泛关注。它研究的是在数据保留在本地提供者的情况下,实现隐私保护的协作机器学习框架。其核心在于,现实世界中的数据通常存在于孤立的数据孤岛中,数据所有者往往不愿意或不被允许将原始数据共享给他人。
联邦学习根据多方数据的可用性可分为以下三种类型:
| 类型 | 描述 | 应用示例 |
| ---- | ---- | ---- |
| 水平联邦学习 | 分布式数据样本跨多个参与方,不同参与者基于共享相同特征空间的不同数据样本协作构建机器学习模型 | Bonawitz等人在大量安卓手机上开发的水平联邦学习系统 |
| 垂直联邦学习 | 不同参与节点持有一组共同数据样本的部分特征 | 信用风险管理、广告 |
| 联邦迁移学习 | 不同方的数据在样本和特征空间上都存在差异,可用于开拓具有不同目标用户群体的新业务 | - |
通信效率是联邦学习系统的主要瓶颈之一,因为它需要移动设备之间或远程数据中心之间进行频繁的通信。此外,出于隐私和安全考虑,采用安全多方计算(MPC)和同态加密等安全模型会导致高昂的计算和通信成本。为了解决这些问题,越来越多的研究致力于实现安全高效的联邦学习。
超级会员免费看
订阅专栏 解锁全文
2万+

被折叠的 条评论
为什么被折叠?



