一.决策树根据属性进行一步步判断,连续值存在无限可能,故为了能够处理连续值,需要将连续值转化为离散值
二.连续属性离散化技术:二分法(最简单)
三.二分法做法:将连续值划分为 >t,<t,两类
- 遍历属性所有值,按从小到大排序
- 则Ta={(ai+ai+1)/2 | 0<i<n }
- 遍历Ta,考察划分点,这里采用信息增益的方式,
- 选取信息增益最大的划分点 a。
四.
参考书籍:机器学习-周志华
二.连续属性离散化技术:二分法(最简单)
三.二分法做法:将连续值划分为 >t,<t,两类
四.
参考书籍:机器学习-周志华