随机森林——分类、回归

最新推荐文章于 2025-07-02 20:19:29 发布

渡渡鸟是我啊

最新推荐文章于 2025-07-02 20:19:29 发布

阅读量6.4k

点赞数 1

CC 4.0 BY-SA版权

分类专栏： # 随机森林、分类、回归 R语言 # 数据分析

本文链接：https://blog.youkuaiyun.com/weixin_41931826/article/details/80639148

本文探讨了随机森林在分类和回归问题中的应用。首先介绍了随机森林在分类任务中的原理和优势，接着详细阐述了如何利用随机森林构建回归模型，并配以回归分析中的图表进行说明。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

随机森林分类

#载入包
library(randomForest)
library(caret)
#读取数据.数据链接：https://github.com/Kuntal-G/Machine-Learning/blob/master/R-machine-learning/data/banknote-authentication.cs
bn<-read.csv("C:\\Users\\Administrator\\desktop\\banknote.csv")
#将相应变量转换为因子
bn$class<-factor(bn$class)
#选择数据的一个子集来建模。在建立每一棵树的时候，随机森林会保留一部分数据用作交叉验证。
在此保留一部分样本仅是为了举例说明用模型来预测整个过程。
set.seed(1000)
sub.idx<-createDataPartition(bn$class,p=0.7,list=FALSE)
#创建随机森林.randomForest函数建立的模型不会保留树的信息，因此无法用这个模型预测未来的样本，
如要强制保留创建的的森林，可以使用keep.forest=TRUE.
mod<-randomForest(x=bn[sub.idx,1:4],y=bn[sub.idx,5],ntree=50