语义网隐私保护与上下文感知隐私设计模式选择
1. 语义网隐私保护:标签抑制策略
1.1 用户标签建模
在语义网的隐私保护中,我们将用户标签建模为随机变量。具体来说,用户标签是在一个包含 n 个类别或主题的有限字母表上的随机变量。通过这种方式,我们可以使用概率质量函数(PMF)来描述用户的个人资料,就如同图 1a 所示的表示方式。我们定义 q 为特定用户标签的概率分布,p 为总体标签的分布。
1.2 标签抑制率与隐私风险
引入标签抑制率 σ,其取值范围为 [0, 1),它表示被抑制标签与总标签的比例。用户的表观标签分布 s 定义为 (s=\frac{q - r}{1 - \sigma}),其中 r = (r1, …, rn) 是满足 (0 \leq r_i \leq q_i) 且 (\sum_{i = 1}^{n} r_i = \sigma) 的抑制策略。
为了衡量隐私风险,我们使用 Kullback - Leibler(KL)散度。隐私风险定义为表观分布与总体分布之间的 KL 散度,即 (D(s \parallel p) = D(\frac{q - r}{1 - \sigma} \parallel p))。
1.3 隐私 - 标签抑制率函数
假设总体足够大,以至于可以忽略 r 的选择对 p 的影响,我们定义隐私 - 标签抑制率函数:
[R(\sigma) = \min_{0 \leq r_i \leq q_i, \sum_{i = 1}^{n} r_i = \sigma} D(\frac{q - r}{1 - \sigma} \parallel p)]
这个函数刻画了隐
超级会员免费看
订阅专栏 解锁全文
49

被折叠的 条评论
为什么被折叠?



