决策树-处理连续值(5)

一.决策树根据属性进行一步步判断,连续值存在无限可能,故为了能够处理连续值,需要将连续值转化为离散值

二.连续属性离散化技术:二分法(最简单)

三.二分法做法:将连续值划分为 >t,<t,两类

  1. 遍历属性所有值,按从小到大排序
  2. 则Ta={(ai+ai+1)/2 | 0<i<n }
  3. 遍历Ta,考察划分点,这里采用信息增益的方式,
  4. 选取信息增益最大的划分点 a。

四.

     

 

参考书籍:机器学习-周志华

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值