利用度量拓宽差分隐私的范围
1. 曼哈顿度量
在某些场景中,完全保护个人价值并非必要。例如,数据库中的个人生日或社交网络注册日期,这些信息本身可能不敏感,但高精度知晓可能会让攻击者识别个人。在这种情况下,我们希望仅保护值的准确性,以较少的噪声实现隐私并提供更准确的结果。
这可以通过曼哈顿度量 $\epsilon d_1$(未归一化)来实现。该度量可能会为相邻数据库分配高于 $\epsilon$ 的可区分性级别,因此隐私保证可能比 $\epsilon$-差分隐私弱。然而,值变化较小的相邻数据库将受到高度保护,攻击者无法准确推断个人值。
与之前类似,我们可以使用相同的隐藏函数 $\Phi_1$ 和邻域 $N_1$ 来刻画 $\epsilon d_1$-隐私。不同之处在于,$\epsilon d_1(\varphi_i, w)$ 和 $\epsilon d_1(N_i, V)$ 现在可能高于 $\epsilon$,提供较弱的保护。但当攻击者已经高精度知晓 $i$ 的值时,即 $V$ 中的值彼此接近,可保证其知识增加的幅度较小(可能甚至小于 $\epsilon$),确保他无法以更高的精度推断该值。
查询的敏感性相对于 $d_1$ 可能比相对于 $d_h$ 低得多。例如,求和查询相对于 $d_1$ 是 1-敏感的,但相对于 $d_h$ 是 $qr$-敏感的。这意味着我们需要添加的噪声可能会大大降低,以较低的隐私为代价提供更好的实用性,但对于给定的应用仍然足够。
以下是一个示例说明:
| 度量 | 最小查询敏感性 | 保护范围 | 可区分性级别 | 实用性 |
| ---- | ---- | ---- | ---- | ---- |
超级会员免费看
订阅专栏 解锁全文
15

被折叠的 条评论
为什么被折叠?



