11、机器学习算法：随机森林、隔离森林与提升算法的应用与实践

最新推荐文章于 2025-11-11 12:47:17 发布

day7

最新推荐文章于 2025-11-11 12:47:17 发布

阅读量45

点赞数

CC 4.0 BY-SA版权

分类专栏：集成学习实战精讲文章标签：随机森林隔离森林提升算法

本文链接：https://blog.youkuaiyun.com/day7/article/details/152551044

集成学习实战精讲专栏收录该内容

19 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

机器学习算法：随机森林、隔离森林与提升算法的应用与实践

1. 隔离森林算法

隔离森林（Isolation forest）是一种基于决策树的算法，主要用于异常值和离群点检测。该算法基于离群数据点稀少的假设，其工作原理与随机森林有所不同。它会创建一系列决策树，然后计算在树中隔离一个观测值所需的路径长度。由于隔离的观测值（即异常值）更容易分离，因为区分它们与正常情况所需的条件较少，所以异常值的路径会比正常观测值短，更靠近树的根节点。当创建多个决策树后，对分数进行平均，就能判断哪些观测值是真正的异常值。

与基于距离和密度的方法相比，隔离森林不使用任何距离或密度度量来检测异常，显著降低了计算成本。在 scikit-learn 中，可以使用 sklearn.ensemble.IsolationForest 来实现该算法，具体链接为：https://bit.ly/2DCjGGF 。