数据隐私与社交网络敏感关系保护
数据隐私对抗组合攻击
在数据隐私保护领域,组合攻击是一个重要的挑战。当多个独立的数据发布者发布具有重叠记录的数据时,攻击者可能会利用这些数据推断出敏感信息。为了解决这个问题,研究人员提出了(ρ, α)-重叠匿名化模型。
数据属性与泛化
首先,我们来看一些数据属性的域大小。以下是相关属性及其域大小的表格:
| Attribute | Domain Size |
| — | — |
| Age | 91 |
| Sex | 2 |
| Education | 17 |
| Marital Status | 7 |
| Birth Place | 50 |
| Occupation | 50 |
在泛化过程中,有两种类型的准标识符(QID)组:重叠QID组和非重叠QID组。非重叠QID组的泛化比较简单,只需找到覆盖所有QID值的最小QID范围,并用这个范围替换原始QID值。而对于重叠QID组,需要找到一个最小QID范围,该范围既要覆盖当前QID组中的所有QID值,也要覆盖已发布数据集中对应重叠QID组的QID泛化范围。例如,重叠QID组GRP1中年龄的泛化范围应该是(15 – 35),而不是(20 – 35),因为(20 – 35)只覆盖了GRP1中的年龄QID值,而已发布数据集Q∗1中对应重叠组的年龄泛化范围是(15 – 25)。
算法1的复杂度主要取决于S∩的元组计算、S - 元组的排序以及最优元组的搜索。假设|P| ≈ |Q∗i|,主要的计算开销在于S∩的计算,即|P| ∗ |P|步,复杂度为O(m2),其中m = |P|。进
超级会员免费看
订阅专栏 解锁全文
828

被折叠的 条评论
为什么被折叠?



