关联规则挖掘中隐私保护扰动的多级访问技术
一、背景与问题提出
在当今数字化时代,数字媒体产生的数据量与日俱增。隐私保护扰动技术,如加法、乘法、几何和差分隐私等,为数据的可靠安全发布提供了保障,使得数据库中的敏感数据不会从发布的数据中被推断出来。然而,现有的隐私保护扰动技术通常假设用户对数据有相同的隐私级别要求,只发布一份固定隐私级别的数据副本。但实际上,用户的数据具有不同的敏感级别,这些数据的共享有助于业务发展。
例如,个人在网上购物时分享自己的身份证号码(如Aadhar),或者公司员工向数据分析师分享业务销售数据以预测销售额,这些敏感数据的共享都存在隐私泄露的风险。传统的隐私保护方法在处理不同隐私级别数据时存在问题。一种是将数据以相同的隐私级别共享给所有用户,这降低了数据对某些用户的可用性;另一种是根据数据共享的敏感级别对数据进行扰动并分别存储,但这种方法存在可靠性和存储成本的问题,数据更新时需要同步更新所有隐私级别的数据,而且存储多份数据会增加公司成本。
二、相关工作
此前已有许多关于隐私保护和数据扰动的研究:
- k - 多样性方法 :Sweeney和Samarati提出的k - 多样性方法,旨在发布微数据而不泄露个体记录的信息,这一方法催生了t - 接近度和l - 多样性等新技术。
- 基于索引的隐私保护技术 :Lee提出了一种基于索引的隐私保护技术,适用于上下文感知计算环境,其隐私保护约束基于用户的推荐而非系统采用的限制。
- 能源数据隐私保护 :Rottondi关注水、电、气等能源的自动抄表数据的开放性
超级会员免费看
订阅专栏 解锁全文
1640

被折叠的 条评论
为什么被折叠?



