数据发布中的隐私保护
在数据发布的过程中,保护数据主体的隐私是至关重要的。随着数据的频繁更新和持续生成,传统的数据隐私保护方法面临着诸多挑战。本文将介绍一些常见的数据隐私保护技术,以及针对多数据发布和数据流场景的解决方案,同时探讨细粒度隐私偏好的相关问题及解决办法。
1. 常见的数据隐私保护技术
- 多关系场景下的ℓ - 多样性扩展 :为了保护受访者属性(除身份外)不被泄露,有方法将ℓ - 多样性的定义扩展到多关系场景。若一组关系集合S的发布满足多关系ℓ - 多样性,则所有发布关系的连接视图对于敏感属性都满足ℓ - 多样性。
- k - 蝴蝶原则 :当待发布的微数据表格具有不同的准标识符时,传统方法将可能对外公开的所有属性集(虽非组合形式)视为准标识符,这可能导致过度的信息损失。k - 蝴蝶原则允许在满足多个准标识符的k - 匿名性要求的同时减少信息损失。具体来说,对于给定的微数据表格和两个准标识符QI1和QI2,若QI1 ∩ QI2中属性值相同的元组子集,其由QI1 \ QI2(或QI2 \ QI1)诱导的等价类各自至少包含k个元组,则该子集满足k - 蝴蝶原则。若微数据关系中所有由QI1 ∩ QI2诱导的等价类都满足k - 蝴蝶原则,则该关系满足k - 蝴蝶原则,且满足k - 蝴蝶原则的元组集对于QI1和QI2都具有k - 匿名性。
- km - 匿名性 :用于保护交易数据中受访者的隐私,因为交易中的部分商品组合可能构成准标识符。km - 匿名性要求最多m个商品的每种组合必须至少出现在k笔交易中,其中m是恶意数据接收者可能知晓的每笔交
超级会员免费看
订阅专栏 解锁全文
3343

被折叠的 条评论
为什么被折叠?



