位置访问行为对重新识别风险的影响
在分布式系统中,个人数据分散在多个位置,其重新识别风险受到多种因素的影响,尤其是位置访问行为。下面将深入探讨不同分布下的位置访问模式与重新识别之间的关系。
1. 分布主导性分析
在考虑所有参数化时,不同分布在位置访问模式的可链接性上表现不同。
- 保留系统 :在保留系统中,Zipf分布通常占据主导地位。如图6(b)所示,Zipf分布在可链接性方面表现突出。
- 非保留系统 :在非保留系统中,Zipf分布既是初始的主导分布,也是最终必然的主导分布。不过,在某些特定范围内,均匀分布比Zipf分布更具主导性。例如,在图6(a)中,大约在8到18个位置之间,均匀分布的主导性得以体现。
分布链接能力主导性发生转变的原因主要有两个:
- 当考虑的位置数量不多时,Zipf分布占主导,因为实现全为1的完整向量较为困难。
- 随着位置数量的增加,Zipf分布再次占主导,因为新考虑的位置通常是访问较少的位置,这些位置更容易将不太可能的轨迹转变为极不可能的轨迹。
| 系统类型 | 主导分布 | 特定范围情况 |
|---|---|---|
| 保留系统 | Zipf分布 | 无特殊范围情况,Zipf始终占优 |
| 非保留系统 | Zipf分布 |
超级会员免费看
订阅专栏 解锁全文

2119

被折叠的 条评论
为什么被折叠?



