18、决策树与集成学习：原理、应用与优化

脑补型产品

于 2025-09-21 11:28:01 发布

阅读量6

点赞数

CC 4.0 BY-SA版权

分类专栏：机器学习实战精华解读文章标签：决策树 CART算法集成学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/mongodb5scout/article/details/154943917

机器学习实战精华解读专栏收录该内容

75 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

决策树与集成学习：原理、应用与优化

决策树基础概念

在机器学习领域，决策树是一种强大且常用的模型。首先来了解一些相关的基础概念。
- P、NP、NP - Hard 和 NP - Complete 问题 ：P 是能在多项式时间内解决的问题集合；NP 是其解能在多项式时间内验证的问题集合；NP - Hard 问题是任何 NP 问题都能在多项式时间内归约到的问题；NP - Complete 问题既是 NP 问题又是 NP - Hard 问题。目前一个重要的数学未解之谜是 P 是否等于 NP，如果 P 不等于 NP（这似乎更有可能），那么对于任何 NP - Complete 问题，可能永远找不到多项式算法（或许在量子计算机上除外）。
- CART 算法 ：CART 算法是一种贪心算法，它在顶层贪婪地搜索最优分割，然后在后续每一层重复此过程。它不会检查该分割是否会在几层之后导致最低的不纯度。而且，寻找最优树是一个 NP - Complete 问题，需要 $O(exp(m))$ 时间，即使对于小的训练集，这个问题也难以处理，所以通常只能接受“合理良好”的解决方案。

决策树的计算复杂度

预测复杂度 ：进行预测时需要从决策树的根节点遍历到叶节点。决策树通常近似平衡，遍历决策树大约需要经过 $O(log_2(m))$ 个节点。由于每个节点只需要检查一个特征的值，所以总体预测复杂度为 $O(log_2(m))$，与特征数量无关。因此，即使处理大型训练集，预测速度也非常快。
训练复杂度 ：训

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。