9、隐私保护数据挖掘算法量化综述

隐私保护数据挖掘算法量化综述

1. 引言

隐私是信息系统必须满足的重要特性之一。为防止在知识发现过程中泄露敏感信息,人们将隐私保护技术与数据挖掘算法相结合。现有的隐私保护数据挖掘(PPDM)技术可从五个维度进行分类:
1. 数据分布(集中式或分布式);
2. 为清理数据而对其进行的修改(加密、扰动、泛化等);
3. 隐私保护技术所针对的数据挖掘算法;
4. 需要保护不被泄露的数据类型(单个数据项或复杂数据关联);
5. 采用的隐私保护方法(启发式或基于密码学的方法)。

启发式技术主要用于集中式数据集,而基于密码学的算法则通过加密技术在分布式场景中保护隐私。近年来提出的启发式算法旨在通过基于概率分布的扰动技术隐藏敏感原始数据。此外,还开发了多种启发式方法,用于隐藏原始数据和聚合数据,这些方法首先应用于关联规则挖掘和分类,最近也用于聚类技术。

由于近年来开发了多种PPDM技术,该领域有必要走向标准化。为PPDM算法提供量化方法,有助于评估和比较这些算法。但由于PPDM算法的多样性,通常没有一种算法能在所有标准上都优于其他算法。因此,为用户提供一套全面的隐私保护相关指标,能帮助他们根据特定参数选择最合适的隐私保护技术。

隐私的定义有多种,从哲学角度可分为三种:个人决定自身哪些信息可传达给他人的权利;对自身信息访问的控制权;对个人及其相关特征的有限访问权。我们认为隐私是实体免受电子存储库中敏感信息未经授权披露的权利,这些信息可以是直接存储的,也可以是从存储的数据中推导出来的聚合和复杂信息。

PPDM算法应实现以下主要目标:
1. 防止发现敏感信息;
2. 能抵抗各种数据挖掘技术;

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值