Python28-1 机器学习算法之决策树

智能建造研究生

已于 2024-07-19 11:53:12 修改

阅读量868

点赞数 19

CC 4.0 BY-SA版权

分类专栏： python学习文章标签：机器学习算法决策树

于 2024-06-29 00:01:09 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/Argulo/article/details/140055108

决策树（Decision Tree）

决策树算法是一种常用的机器学习算法，属于监督学习范畴。它可以用于分类和回归任务，具有易于理解和解释的特点。决策树通过递归将数据分割成更小的子集，构建一个树形结构，其中每个节点代表一个特征的测试，分支代表测试结果，叶子节点代表最终的分类或回归结果。

1. 基本概念

根节点（Root Node）：树的最顶端节点，包含所有数据样本。
内部节点（Internal Nodes）：每个内部节点表示一个特征的测试，根据测试结果将数据分成两个或多个子集。
叶子节点（Leaf Nodes）：树的末端节点，表示最终的分类或回归结果。
分支（Branches）：从一个节点到下一个节点的路径，代表特征测试的结果。

2. 构建过程

构建决策树的过程涉及以下几个步骤：

选择最优特征：在每个节点选择一个特征来分割数据。选择的标准通常是信息增益、信息增益率或基尼指数等。
数据分割：根据选择的特征和阈值，将数据分割成子集。
递归分割：对每个子集重复上述步骤，直到满足停止条件，如所有数据属于同一类或达到最大树深度。
构建树形结构：将上述分割过程形成树形结构，根节点和内部节点代表特征测试，叶子节点代表最终预测。

3. 特征选择标准

信息增益（Information Gain）：衡量特征在分割数据后信息熵的减少量。选择信息增益最大的特征进行分割。

最低0.47元/天解锁文章

200万优质内容无限畅学

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。