xgboost（R语言实现）

原创

已于 2022-04-28 23:47:55 修改 · 1.5w 阅读

CC 4.0 BY-SA版权

文章标签：

于 2022-03-13 19:13:59 首次发布

install.packages("xgboost")
require(xgboost)

set.seed(2021)

seed：随机种子，用于产生可复现的结果

data("agaricus.train",package="xgboost")
data("agaricus.test",package="xgboost")
train <- agaricus.train
test <-agaricus.test

这份数据需要我们通过一些蘑菇的若干属性判断这个品种是否有毒。数据以 1 或 0 来标记某个属性存在与否。

class(train$data)可以看到样例数据为稀疏矩阵类型

如果数据不是稀疏矩阵类型，则需要进行预处理。

这部分以iris为例

10 条评论

林不多鱼 2023.11.24
您好，请问输出这段之后 xgboost_roc<-roc(agaricus.test$label,as.numeric(pred2)) 会显示红色提示 Setting levels: control = 0, case = 1 Setting direction: controls < cases 这个红色提示是正常，还是报错？

Achilleslee_ 2023.09.17
您好，按照您的步骤dtest<-xgb.DMatrix(data=testset$data,label=testset$label)这一步会报错，报错内容为Error in setinfo.xgb.DMatrix(dmat, names(p), p[[1]]) : The length of labels must equal to the number of rows in the input data，想请教您一下怎么解决

m0_56050786 2022.04.26
您好，请问第3部分的建立模型和第4部分的建立模型有什么区别呀？
- m0_62100377回复m0_56050786 2024.01.24
  您好，我也有这方面的疑惑到底是一样的嘛？
- 淮也回复m0_56050786 2022.04.26
  我感觉好像没区别，第3部分本来只写的数据处理，后来修正索性就加上了建立模型（浅学了一下，不知道对不对哈）