数据共享可滥用性的 tkl-Score 评估方法解析
在数据共享的过程中,保护数据隐私至关重要。为了评估数据共享的可滥用性,人们提出了多种方法,如 M-Score 和 L-Severity 等,但这些方法存在一定的局限性。本文将介绍一种新的评估方法——tkl-Score,它综合考虑了多种隐私保护指标,能更全面地评估数据共享的风险。
1. L-Severity 方法及其局限性
L-Severity 方法通过对记录分数求和来解决 M-Score 的近似性问题,其计算公式为:
[L - Severity=\sum_{r\in T}\left(\frac{\sum_{Asi\in r}weight(Asi)}{DF_{kr}}\right)]
其中,$r$ 是发布表中的每条记录,$Asi$ 是记录 $r$ 的第 $i$ 个敏感属性值,$DF_{kr}$ 是记录 $r$ 的 $k$ - 区分因子。
然而,L-Severity 存在一些缺点:
- 它无法处理假设发布表中最大记录分数即为最大严重程度的情况。由于没有像 M-Score 那样的 $x$ 参数,它不能控制记录数量重要性和最大严重程度之间的权衡来计算分数,仅考虑基于发布记录数量计算严重程度。
- 与 M-Score 一样,L-Severity 未能考虑像 $l$ - 多样性和 $t$ - 接近度这样的匿名性度量来处理属性披露问题,仅使用 $k$ - 区分因子考虑身份披露。虽然其作者建议可以将属性披露度量集成到可滥用性评分中,但未提供具体方法。
2. tkl-Score 的提出
为了克服上述方法的局限性,我们提出了 tkl-Score 方法。它结合了隐私
超级会员免费看
订阅专栏 解锁全文
759

被折叠的 条评论
为什么被折叠?



