作者:禅与计算机程序设计艺术
1.背景介绍
在联邦学习(Federated Learning)的过程中,由于参与方的数据是隐私保护的,因此需要对其进行保护。传统的解决方案是在客户端或服务端上进行数据匿名化处理,而Themis则试图通过分布式加密协议和隐私库集成的方式,来保障联邦学习过程中的用户数据的隐私。Themis是一个开源框架,可用于保护联邦学习中不同设备间、不同参与方之间的隐私。 Themis项目由滴滴出行AI平台的多个技术团队共同开发完成。其主要功能包括:
- 差分隐私机制——通过分布式加密协议生成的添加噪声后的客户端数据,可以减少参与者数据泄露带来的影响。
- 数据标识符(Data Identifiers)——Themis提供的统一标识符服务,将原始数据转换为具有唯一身份的可追溯数据。
- 隐私库集成——Themis支持多种隐私保护的工具库集成,包括TensorFlow Privacy,PyTorch DP-SGD,FATE等,并将这些工具库的功能嵌入到Themis中。
- 高性能计算——通过联合学习训练模型时,Themis可以在不同设备之间高效共享加密密钥和明文数据,来提升计算速度。
- 可扩展性——Themis通过模块化设计和插件接口的形式,让新功能容易接入到框架中。
2.核心概念与联系
2.1 概念介绍
2.1.1 隐私预算
隐私预算(Privacy Budget)定义了联邦学习中的参与者可以用来保护用户隐私的资源量。在联邦学习中,每一