41、隐私保护关联规则挖掘的新方案

隐私保护关联规则挖掘的新方案

1. 引言

在数据挖掘过程中,准确挖掘结果与保护数据隐私是两个重要的问题。关联规则挖掘是一个活跃的研究领域,有许多算法被提出和分析,但很少有算法解决隐私保护问题。

隐私保护关联规则挖掘系统可分为两类:企业对企业(B2B)和企业对客户(B2C)。在B2B系统中,交易分布在多个站点,各站点协作挖掘跨多个数据库的关联规则;在B2C系统中,一个数据挖掘者和多个数据提供者组成系统,每个数据提供者持有一个交易,数据挖掘者对数据提供者提供的聚合交易进行关联规则挖掘,在线调查就是典型的B2C系统。

大多数关于B2C系统的隐私保护关联规则挖掘研究默认随机化是保护隐私的有效方法。本文提出了一种将代数技术与随机噪声扰动相结合的新方案,具有以下特点:
- 能更准确地识别关联规则,同时披露更少的私人信息。模拟数据显示,在相同的准确性水平下,该系统披露的私人交易信息比以前的方法少约五倍。
- 易于实现且灵活。隐私保护机制不需要支持恢复组件,对数据挖掘过程透明,可作为中间件与现有系统集成。
- 允许数据提供者和数据挖掘者就准确性和隐私之间的权衡进行明确协商。数据提供者可以选择自己的隐私级别,有助于数据挖掘者与不同隐私偏好的人合作。

2. 方法

2.1 数据和交易模型

设 $I$ 是一组项目,数据集由 $n$ 个交易组成,每个交易由 $I$ 的一个子集表示,数据集可以用一个 $n \times m$ 矩阵 $T$ 表示。矩阵元素 $T_{ij}$ 表示项目 $j$ 是否出现在交易 $i$ 中。

项目集 $B$ 的支持度定义为包含 $B$ 的交易数占总交易数的比例。如

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值