提升k - 匿名微聚合的时间复杂度和实用性
在数据隐私保护领域,k - 匿名微聚合是一种重要的技术,旨在对数据进行处理,使得每个数据簇中至少有k个元素,从而保护个体的隐私。本文将对多种k - 匿名微聚合算法进行实验评估和分析,探讨它们在时间复杂度和信息损失方面的性能表现。
1. 实验评估
为了比较不同的启发式算法,我们使用了多个真实和合成的基准数据库,包括Census、Tarragona、EIA等。在实验中,我们固定了匿名化参数k的值,即K = {2, 3, 4, 5, 7, 10},并对数据库的属性进行了标准化处理,使其均值为0,方差为1。
1.1 最大距离(MD)启发式算法
我们对MD、MDAV、MDAV+、V - MDAV、MDAV∗和MDAV∗γ等多种MD启发式算法进行了实验,比较了它们在不同k值下的运行时间和信息损失。
| k | 2 | 3 | 4 | 5 | 7 | 10 |
|---|---|---|---|---|---|---|
| MD | 2.38 | 1.58 | 1.15 | 0.91 | 0.67 | 0.49 |
| MDAV | 0.23 | 0 |
超级会员免费看
订阅专栏 解锁全文
868

被折叠的 条评论
为什么被折叠?



