决策树

决策树原理与应用
本文介绍了决策树这一基于概率分析的图解法决策工具。它通过构建决策树模型来评估项目风险并判断可行性。文中详细解释了如何使用熵来衡量数据集的不一致性,并介绍了ID3算法在划分标称型数据集中的应用。此外,还探讨了决策树构建过程中可能出现的过度匹配问题及其解决方案。

  决策树(Decision Tree)是在已知各种情况发生概率的基础上,通过构成决策树来求取净现值的期望值大于等于零的概率,评价项目风险,判断其可行性的决策分析方法,是直观运用概率分析的一种图解法

  决策树分类器就像带有终止块的流程图,终止块标示分类结果。开始处理数据集时,我们首先需要测量集合中数据的不一致,也就是熵,然后寻找最优方案划分数据集,直到数据集中的所有数据属于同一分类。ID3算法可以用于划分标称型数据集。构建决策树时,我们通常采用递归的方法将数据集转化为决策树。

         决策树可能会产生过多的数据集划分,从而产生过度匹配数据集的问题。我们可以通过裁剪决策树,合并相邻的无法产生大量信息增益的叶节点,消除过度匹配问题。

         还有其他的决策树的构造算法,C4.5和CART

转载于:https://www.cnblogs.com/huanhuanang/p/5159782.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值