差分隐私:拉普拉斯与高斯噪声对比及其他方法探讨
1. 拉普拉斯与高斯噪声比较
在差分隐私中,评估和比较拉普拉斯与高斯噪声,需要从敏感度的基础概念入手。这两种机制对敏感度有不同的定义。通常理解的敏感度是一个人对一个值的影响程度,但在差分隐私中,还需考虑一个人对要发布的数据值或要回答的查询值的影响频率和程度。
以人力资源分析为例,要分析特定团队或部门是否存在领导需解决的问题,为保护提供问题的个人,需要计算每个团队或部门的平均投诉数量以及投诉解决的平均时间。
- 确定边界 :由于每月投诉数量范围是 0 到无上限,选择 0 - 10 的范围;同时将投诉解决时间范围设定为 0 - 5。
- 敏感度计算 :对于计算的指标,为保护添加多个未解决投诉的人,可能需要 5 × 10 的敏感度。
噪声和误差会随着一个人能影响的统计数量线性增加。在多维向量空间中,为添加合适的差分隐私机制,拉普拉斯机制使用曼哈顿距离(L1 范数)优化和最小化误差与噪声,而基于高斯的机制使用欧几里得距离(L2 范数),因为高斯噪声的误差是正态分布的。
- 曼哈顿距离(L1 范数)计算 :$|x| 1 = \sum {i=1}^{N} |x_i|$
- 欧几里得距离(L2 范数)计算 :$|x| 2 = \sqrt{\sum {i=1}^{N} |x_i|^2} = \sqrt{x^T x}$
以添加噪声到投诉数据为例,若使用拉普拉斯噪声,当同事发送 10 个或更多未解决投
超级会员免费看
订阅专栏 解锁全文
4494

被折叠的 条评论
为什么被折叠?



