前言:
前一段时间,导师要求我去使用随机森林帮他做一个分类,他给的样本是两个mat文件,应该是一个正样本,一个负样本,然后就开始了使用R做随机森林的探索之旅。
其中遇到的问题也是多种多样,包括数据处理,类型的转换,最终也让自己对randomForest的输入要求有了一个比较好的理解。
数据:
准备工作:
首先当然是安装好R中随机森林包了,输入命令:install.packages("randomForest")
随后我便查看了一下randomForest的帮助文档:原谅我性急,直接看操作示例
这便是使用R做随机森林分类的一个示例,打开iris数据显示改数据集有150个样本,分别是setosa、versicolor、 virginica各50个,每种花都有四种特征## Classification: ##data(iris) set.seed(71) iris.rf <- randomForest(Species ~ ., data=iris, importance=TRUE, proximity=TRUE) print(iris.rf) ## Look at variable importance: round(importance(iris.rf), 2)