西瓜书学习记录-决策树(第四章)
第四章啦

知乎黄耀鹏-决策树算法的Python实现:
https://zhuanlan.zhihu.com/p/20794583
















一般分布例子如下:(见下具体例题)




以上例题详情可见西瓜书第4章:(截图如下,其中图和表均见上方截图)















代码示例:






简单说一下:根据gini指数来决定要不要继续往下分支








(预剪枝)第一次分:

第二次分:

精度从7分之5下降到了7分之4,所以剪枝,不要往下面再分了!!!对于预剪枝来讲,这个分支就到这儿了

对于稍凹这个分支来说,下面的分支的精度依然是7分之5,根据预剪枝来讲,也不再继续向下分支了
下面是后剪枝:(后剪枝就是保留所有的情况,然后从下往上开始减,如果往上精度提高则剪枝,如果往上精度不变则不剪)




缺失值处理例子:(见下图)
忽略缺失值的情况:











看的大佬的教学视频,标明一下出处:
https://www.bilibili.com/video/BV17J411C7zZ
记录一下,方便以后自己复习,加油!
7694

被折叠的 条评论
为什么被折叠?



