决策树算法及其python实例

m0_74831463

于 2024-04-29 23:11:29 发布

阅读量1.4k

点赞数 8

文章标签：算法决策树 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/m0_74831463/article/details/138257989

版权

一、决策数的概念

什么是决策树算法呢？

决策树（Decision Tree）是一种基本的分类与回归方法，本文主要讨论分类决策树。决策树模型呈树形结构，在分类问题中，表示基于特征对数据进行分类的过程。它可以认为是if-then规则的集合。每个内部节点表示在属性上的一个测试，每个分支代表一个测试输出，每个叶节点代表一种类别

二、决策树的构造

1、决策树的构造步骤

       输入：训练集D={(21,11),(z2,32),...,(am,3m)};
       属性集 A = {a1,a2, ..,ad}。
       过程：函数 TreeGenerate(D, A)
       首先生成结点 node，如果D中样本全属于同一类别C 则将node 标记为C 类叶结点;如果A 为空或者D中样本在A 上取值相同则将node 标记为叶结点，其类别标记为 D中样本数最多的类;然后从A中选择最优的划分属性x;遍历x属性的每一个值，进而为node生成一个分支。将分支结点标记为叶结点，其类别标记为 D中样本最多的类;返回 TreeGenerate(Do, A\ {a.})为分支结点。实现了以node 为根结点的一棵决策树。

2、划分选择

划分选择即如何选择最优划分属性。一般而言，随着划分过程的不断进行，我们希望决策树的分支节点所包含的样本尽可能的属于同一类别，即结点的“纯度”越来越高。

2.1、信息增益

“信息熵〞(information entropy)是度量样本集合纯度最常用的一种指标。假定当前样本集合口中第类样本所占的比例为pk（h=1,2，…•，11)，则D的信息熵定义为

Ent(D）的值越小，则D的纯度越高。

假定离散属性a有V个可能的取值 ta',a’，，，a!}，若使用。来对

最低0.47元/天解锁文章

博客等级

码龄3年

6
原创

72
点赞

86
收藏

90
粉丝

关注

私信

热门文章

上一篇：: KNN算法的理解及鸢尾花分类实例的实现

下一篇：: 贝叶斯决策基本原理和例题实战

最新评论

支持向量机svm
优快云-Ada助手: 算法技能树或许可以帮到你：https://edu.youkuaiyun.com/skill/algorithm?utm_source=AI_act_algorithm
贝叶斯决策基本原理和例题实战
优快云-Ada助手: 恭喜用户写了第三篇博客，标题为“贝叶斯决策基本原理和例题实战”。内容看起来很有深度，对贝叶斯决策进行了详细的介绍和实战演练，让读者能够更好地理解这一概念。希望用户能够继续保持创作的热情和耐心，不断提升自己的写作水平。接下来，建议可以尝试拓展其他相关主题，或者深入研究贝叶斯决策的其他应用领域，为读者带来更多有价值的内容。期待用户的下一篇作品！祝您写作顺利！优快云正在通过评论红包奖励优秀博客，请看红包流：https://bbs.youkuaiyun.com/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。