表格数据敏感性规则比较及预表格扰动控制调整的研究
在数据处理和分析中,表格数据的敏感性规则以及数据保护方法至关重要。本文将探讨不同敏感性规则的比较,以及一种新的预表格扰动控制调整方法。
不同敏感性规则的比较
在比较不同规则时,不能简单地说一个规则比另一个更保守。因为通过改变参数值,每个规则都可以调整为更保守或更宽松。选择使用哪个规则的决策应基于其他因素。一种方法是研究两个规则给出不同决策的数据集,并评估哪个决策似乎是最好的。
不同规则之间最重要的区别在于,区间规则仅依赖于入侵者已知的信息,而其他规则依赖于观测值的分布,这是入侵者所不知道的。敏感性规则的目的是确保入侵者无法根据发布的数据获得关于其他受访者的过多信息。
当发布一个单元格中所有对象的总值时,入侵者会获得新信息,并可以缩小其他受访者可能值的范围。在某些假设下,这些可能值可以用一个区间来描述。这个区间的宽度描述了入侵者已知的信息。在考虑一个单元格是否安全时,真实值在这个区间内的位置不应影响决策。
以下是不同规则决策不同时的数据集绘图示例:
|决策情况|x (百分比)|数据集|
| ---- | ---- | ---- |
|D敏感P安全|0.0 - 1.0|5 - 15|
|D安全P敏感|0.0 - 1.0|5 - 20|
新规则:预表格扰动控制调整
Controlled Tabular Adjustment (CTA) 是一种为表格数据开发的统计披露控制 (SDC) 方法。它旨在找到与给定原始表格最接近的加法表,确保所有机密单元格的调整值安全地远离其原始值。
在实际应用中,通常不
超级会员免费看
订阅专栏 解锁全文
726

被折叠的 条评论
为什么被折叠?



