主要内容
(1)C4.5算法简介
(2)C4.5算法节点分裂规则
-------------------------------------------------------------------------------------------------------------------------
一、概述
参照ID3:https://blog.youkuaiyun.com/gyq423/article/details/81946089
C4.5相比于ID3,主要是将ID3的分裂规则(信息增益最大)变为信息增益率最大,其公式为
整体信息熵
特征A的信息熵
特征A的信息增益
特征A的信息增益率
属性A的分布情况,混乱度越大,GainRatio越小,越纯净,GainRatio越大
二、总结
C4.5的特点:
(1)克服了ID3用信息增益选择属性时偏向于属性较多的属性的不足
(2)支持连续变量
(3)与ID3一样,只能用于分类
注:以上内容属个人理解,学艺不精,请各位大神多多指教