决策树详解

最新推荐文章于 2025-04-20 21:19:34 发布

原创

最新推荐文章于 2025-04-20 21:19:34 发布 · 331 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#决策树 #机器学习

决策树是一种基于特征向量划分特征空间的分类方法。文章详细介绍了信息增益、熵、条件熵、信息增益比等概念，用于确定特征选择。此外，还探讨了决策树的剪枝策略，以防止过拟合，提高模型泛化能力。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

决策树

决策树通过分析样本的特征分布情况对实例进行分类或预测输出值。决策树每深入一层都是在选定特征向量划分特征空间，到达叶结点时，即可得到实例对应的类别或输出值。

信息增益

决策树每深入一层都需要选定一个特征向量，那么选定哪个特征向量会更有利于分类呢，这需要用到信息增益。

熵

首先我们要了解信息熵，熵是表示随机变量不确定性的度量，熵越大那么随机变量的不确定性就越大。这个概念借用自热力学中的熵，热力学中的熵是体系混乱程度的度量，熵越大，体系越混乱，越混乱，自然不确定性就越大。

设X是一个取有限个值的离散随机变量，在决策树中它是特征向量也是实例归属的种类（有限个离散值），当为特征向量时，特征向量亦有有限个离散取值。

例如球有三种属性

$X^{(1)}$ 材质：塑料；金属
$X^{(2)}$ 质量：100g；300g
$X^{(3)}$ 体积： $50cm^3$ ； $100cm^3$

我们规定，球的颜色由其属性决定，有三种可能：红色、绿色、蓝色。那么X可以是颜色，也可以是属性（特征向量）如：材质。

X的概率分布为
$P(X=x_i)=p_i,i=1,2,...,n \tag 1$
其中 $x_i$ 是X的可能取值，当X为球的颜色时， $x_1=red,x_2=green,x_3=blue$

则随机变量X的熵定义为

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。