决策树

最新推荐文章于 2024-04-29 12:14:03 发布

转载最新推荐文章于 2024-04-29 12:14:03 发布 · 217 阅读

本文深入探讨决策树这一基本的分类与回归方法，涵盖特征选择、决策树生成与修剪三大步骤。解析信息熵、条件信息熵等概念，以及信息增益、信息增益比和基尼指数在特征选择中的应用。对比ID3、C4.5和CART三种决策树生成算法，阐述各自划分标准的优劣。

决策树（decision tree）：是一种基本的分类与回归方法，此处主要讨论分类的决策树。

决策树通常有三个步骤：特征选择、决策树的生成、决策树的修剪。

决策树学习的目标：根据给定的训练数据集构建一个决策树模型，使它能够对实例进行正确的分类。

决策树学习的本质：从训练集中归纳出一组分类规则，或者说是由训练数据集估计条件概率模型。

决策树学习的损失函数：正则化的极大似然函数

一特征选择

信息熵：

当熵中的概率由数据估计(特别是最大似然估计)得到时，所对应的熵称为经验熵(empirical entropy)。什么叫由数据估计？比如有10个数据，一共有两个类别，A类和B类。其中有7个数据属于A类，则该A类的概率即为十分之七。其中有3个数据属于B类，则该B类的概率即为十分之三。浅显的解释就是，这概率是我们根据数据数出来的。