隐私保护分类中的保留替换方法及其分类器构建
1. 隐私保护分类概述
在隐私保护分类中,训练实例通常是经过扭曲处理的,这使得分类任务变得复杂。主要涉及决策树、基于新兴模式的急切分类器和懒惰分类器的构建,并且着重处理连续属性经过保留替换随机化方法扭曲后的数据。
2. 分类算法介绍
2.1 急切隐私保护分类器(ePPCwEP)
- 训练步骤 :
- 发现新兴模式(EPs) :将连续和标称属性转换为二进制属性,根据类标签将训练集划分为子集,使用MMASK挖掘频繁集,存储支持度,找出满足增长率阈值的EPs。
- 计算统计信息 :为每个类的所有训练实例计算聚合分数和基础分数。
- 测试步骤 :为每个测试实例计算聚合和归一化分数,将具有最大归一化分数的类分配给测试实例。
Algorithm 1. ePPCwEP, the eager Privacy Preserving Classifier with Emerging Patterns
input: D // distorted training set (can contain binary, nominal and continuous attributes)
input: S // undistorted test set
input: minimumS
超级会员免费看
订阅专栏 解锁全文
2092

被折叠的 条评论
为什么被折叠?



