数据挖掘中关联规则隐藏与匿名指纹方案的研究
在数据挖掘领域,保护敏感信息和数字版权是两个重要的研究方向。本文将介绍关联规则隐藏算法的相关内容,包括算法的输入输出、性能评估,以及匿名指纹方案的模型、存在的问题等。
关联规则隐藏算法
关联规则隐藏算法的目的是对数据库进行转换,使得指定的规则无法被挖掘出来。以下是算法的输入输出和主要流程:
- 输入 :需要隐藏的规则集合 Rh
、源数据库 D
、最小置信度阈值 min conf
和最小支持度阈值 min supp
。
- 输出 :转换后的数据库 D
,使得 Rh
中的规则无法被挖掘。
下面是相关算法的代码实现:
INPUT: a set Rh of rules to hide, the source
database D, the min conf threshold,
the min supp threshold
OUTPUT: the database D transformed so
that the rules in Rh cannot be mined
BEGIN
FOREACH rule U IN Rh DO
{
REPEAT UNTIL (conf(U) < min conf
OR supp(U) < min supp )
{
1. T = { t in