博客出于待完善学习状态
熵的概念
信息增益
信息增益比
基尼指数
ID3
C4.5
CART(Classification And Regression Tree)
如何剪枝,
如何处理缺失值
如何处理连续值?
还有进一步的集成模型里选取的决策树,比如随机森林里用的哪种决策树,GBDT利用的哪种决策树?
如果考虑特征相关性问题,有没有这样的决策树算法处理这方面的问题。
各个算法的优缺点,与随机森林,GBDT的关系。
博客出于待完善学习状态
如何剪枝,
如何处理缺失值
如何处理连续值?
还有进一步的集成模型里选取的决策树,比如随机森林里用的哪种决策树,GBDT利用的哪种决策树?
如果考虑特征相关性问题,有没有这样的决策树算法处理这方面的问题。
各个算法的优缺点,与随机森林,GBDT的关系。