含空值微数据的k - 匿名性与空间数据的自适应安全风险管理
在数据处理和安全管理领域,含空值微数据的匿名化处理以及空间数据的自适应安全管理是两个重要的研究方向。下面将分别对这两个方面进行详细介绍。
含空值微数据的k - 匿名性
在微数据中,空值(NULL)是常见的情况,然而当前的匿名化算法通常要求在进行匿名化之前移除所有包含空值的行。为了解决这个问题,研究人员开发了一种灵活且可定制的工具ANON,用于计算k - 匿名和ℓ - 多样化的表格。
ANON工具提供了两种处理空值的方式:
- 基本匹配(basic match) :在匿名化之前移除包含空值的行。
- 扩展匹配(extended match) :将空值视为其他普通值进行处理。
为了比较这两种匹配方式的效果,研究人员进行了一系列实验。实验使用了来自UCI机器学习库的成人数据库(Adult Database),并设置了不同的参数和空值比例。具体步骤如下:
1. 数据准备 :
- 从成人数据库中移除包含空值的行,得到一个包含45222条记录的基础表。
- 根据准标识符的数量(1到8)和随机插入空值的百分比(0.1%、0.5%、1%、2.5%、5%、7.5%、10%、15%、20%、25%、30%)的组合,创建88个测试表。使用Java的随机数生成器来确定插入空值的单元格位置。
2. 参数设置 :
- k参数:2、3、4、5、10、15、20、50、100。
- 最大允许抑制率:0%、
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



