数据隐私保护技术:ε-差分隐私及相关技术解析
1. ε-差分隐私基础概念
在数据隐私保护领域,ε-差分隐私是一项重要的技术。它引入了“隐私预算”的概念,用户可以根据自身需求“花费”这个预算。其具有可组合性,即一个 ε1 - 差分隐私机制之后再执行一个 ε2 - 差分隐私机制,整体将是 (ε1 + ε2) - 差分隐私的。
例如,给定 λ = (GSA)(1/ε),如果已知会有 k 次查询,我们可以将每次查询的隐私级别设置为 ε/k。那么 λnew = λk,经过 k 次查询和响应后,隐私级别将达到预期的 ε。这是因为从拉普拉斯分布中抽取 k 个样本的均值的最大似然估计(MLE)是这 k 个样本的中位数。为了保证在有 k 个样本时对均值的最佳估计与只有一个样本时的最佳估计相当,我们需要将分布扩大 k 倍。
需要注意的是,这里关注的统计量是最大似然估计(MLE),而非中心极限定理(CLT),因为 CLT 关注的是样本数量趋近无穷时的情况,而 MLE 适用于任意数量 k 的样本。
2. ε-差分隐私的增强
2.1 近似差分隐私 (ε, δ) - DP
2006 年,Cynthia Dwork 等人提出了对 ε-差分隐私的首次增强。在实际环境中,ε-差分隐私计算考虑了所有仅在一个条目中不同的数据库对以及所有可能的输出,但对于那些概率极低的输出往往会被忽略。Dwork 等人通过允许一个额外的小概率情况,即上界 ε 不成立的情况,放宽了 ε-差分隐私的定义,以适应隐私损失大于 eε 的输出。这种近似差分隐私通常表示为 (ε, δ) - DP,在研究文献中被广泛引用和使用。
一个函数 A 是 (ε, δ)
超级会员免费看
订阅专栏 解锁全文
357

被折叠的 条评论
为什么被折叠?



