决策树优缺点
- 优点:计算复杂度不高,输出结果易于理解,对中间值的确实不敏感,可以处理不相关特征数据。
- 缺点:可能会产生过度匹配问题。
- 适用数据类型:数值型和标称型。
原理
树结构
信息增益
在划分数据集之前之后信息发生的变化称为信息增益。
香农商
集合信息的度量方式称为香农熵或者简称为熵,这个名字来源于信息论之父克劳德.香农。
例子
略
实际中的应用——预测隐形眼镜类型
隐形眼镜数据集是非常著名的数据集。构造树结构。
本文介绍了决策树算法的优点和缺点,包括其计算复杂度不高、输出结果易于理解等优点,以及可能产生的过度匹配问题等缺点。此外,还讲解了决策树的基本原理,如树结构、信息增益和香农熵,并通过隐形眼镜类型预测的实际案例展示了如何构建决策树。
树结构
在划分数据集之前之后信息发生的变化称为信息增益。
集合信息的度量方式称为香农熵或者简称为熵,这个名字来源于信息论之父克劳德.香农。
略
隐形眼镜数据集是非常著名的数据集。构造树结构。
887
485

被折叠的 条评论
为什么被折叠?