数据隐私保护:动态层次结构与图随机化方案
1. 数值准标识符属性动态层次结构创建方法
在数据处理中,为数值准标识符属性动态创建层次结构是一项重要工作。新提出的方法为预定义层次结构提供了有效的替代方案。使用这种新方法生成的层次结构,通常能得到高质量的掩码微数据,同时信息损失也在合理范围内。
在两种信息损失度量指标,即归一化总信息损失(NTIL)和基于平均范围度量的归一化信息损失(NIL1)方面,新方法明显优于现有的即时生成数值层次结构的方法。与另外两种即时创建层次结构的方法(OTF 和 Chu)相比,对于其他三种信息损失度量指标,即基于最大范围度量的归一化信息损失(NIL∞)、可辨别性度量(DM)和平均聚类大小(AVG),新方法也取得了相似或略好的结果。
即时生成层次结构的优势在于,当需要层次结构时可以轻松生成,而无需用户人为开发可能无法反映数据特性的层次结构,从而避免对掩码微数据的质量产生负面影响。
2. 图数据隐私保护问题提出
图是一种有效的结构,常用于表示网络数据。节点代表实体,边反映实体之间的关系。例如在社交网络应用(如 Facebook)中,图可以捕捉个体之间的友谊关系。通过分析图,研究人员可以获得有关社区形成与演变、疾病传播等方面的有趣知识。
然而,图关联的数据包含敏感信息,如社区健康数据库中的个人医疗记录、社交网络中的个人友谊以及政府合作网络中议员之间的私人立法合作等。因此,保护发布图中个人信息的隐私至关重要。
目前保护图中个人信息隐私的方法存在诸多问题,容易受到各种类型的攻击。例如,Backstrom 等人表明,即使对节点的身份信息(如社交 ID 和姓名)进行清理,攻击者凭借非常有限
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



