保障用户位置隐私与分布式环境下重识别风险研究
在当今数字化时代,用户的位置隐私保护以及数据的匿名性面临着诸多挑战。本文将探讨如何衡量查询答案的质量、位置伪装的效果,以及位置访问行为对重识别风险的影响,并提出相应的解决方案。
1. 查询答案质量的衡量
为了衡量返回答案 (R) 与每个子结果 (R_k) 之间的相似度,我们定义了关于 (R_k) 的 (R) 的精度 (V(R_k)):
[V (R_k) = \frac{|R_k|}{|R|}]
其中,(V(R_k)) 表示为了使 (R_k) 变成 (R) 而注入的 “杂质” 量。当 (V(R_k)) 从 0 增加到 1 时,(R_k) 与 (R) 更接近。因此,如果 (S) 位于 (A_k) 中,(V(R_k)) 可作为衡量 (R) 与 (R_k) 接近程度的分数。
假设 (S) 位于 (A_1) 的概率为 (p(R_1)),那么 (p(R_1) \cdot V(R_1)) 可视为以 (S_1) 得到 (R_1) 作为真实答案的概率加权的精度。
一般来说,若 (U) 根据答案的差异被划分为 (B) 个子区域,则 ILRQ 的查询分数可以通过 (U) 所有子区域的加权精度值之和来衡量:
[Query\ score = \sum_{k=1}^{B} p(R_k)V (R_k)]
查询分数在 0(最低质量)到 1(最高质量)之间变化。例如,在某个示例中,查询分数为 (0.2 \cdot 0.5 + 0.3 \cdot 1 + 0.2 \cdot 0.5 + 0.3 \cdot 0 = 0.32)。
计算 (p(R_k))(即 (S) 得到答案 (R_k) 的概率
超级会员免费看
订阅专栏 解锁全文
5万+

被折叠的 条评论
为什么被折叠?



