数据隐藏算法的信息驱动评估与频繁模式的完美覆盖
数据隐藏算法评估相关内容
在数据挖掘领域,隐私保护数据挖掘(PPDM)算法的数据质量评估是一个重要问题。下面将详细介绍相关的评估方法和框架。
数据质量指标
- 准确性缺失指数(ACL) :对于一个AIS(假设信息系统)A的属性k,其准确性缺失指数定义为数据库SD中非准确项的比例。计算公式为:
[ACL = \sum_{i = 0}^{n} DMG.Ni.AV * DMG.Ni.AW]
其中,DMG.Ni.AW是与节点Ni标识的属性相关的准确性权重。 - 完整性缺失指数(CML) :属性k的完整性缺失定义为SD中非完整项的比例。计算公式为:
[CML = \sum_{i = 0}^{n} DMG.Ni.CV * DMG.Ni.CW] - 一致性缺失指数(CSL) :与AIS相关的一致性缺失指数由所有净化事务中发生的约束违规数量乘以每个约束(简单或复杂)的权重得出。计算公式为:
[CSL = \sum_{i = 0}^{n} DMG.SCi.csv * DMG.SCi.cw + \sum_{j = 0}^{m} DMG.CCj.csv * DMG.CCj.cw]
评估算法
评估数据质量的方法主要分为两个阶段:
1. 搜索阶段 :识别净化数据库中所有修改的元组。将这些事务的主键(假设净化过程不改变主键)存储在一个名为evalset
超级会员免费看
订阅专栏 解锁全文
4907

被折叠的 条评论
为什么被折叠?



