离散化是将连续属性的范围划分为区间。
有效的规约数据应用在例如 基于判定树的分类挖掘。
1) 离散化
通过将属性域划分为区间,减少给定连续属性值的个数。区间的标号可以代替实际的数据值。
2) 概念分层
通过使用高层的概念(比如:青年、中年、老年)来替代底层的属性值(比如:实际的年龄数据值)来规约数据
本文介绍了离散化技术,即如何将连续属性的范围划分为区间,以及概念分层方法,通过使用高层概念替代底层属性来规约数据。这些方法在基于判定树的分类挖掘中有广泛应用。
2452

被折叠的 条评论
为什么被折叠?