机器学习中的回归与黑盒方法探索
1. 回归树模型性能评估
在使用回归树模型对测试数据进行预测时,可使用 predict() 函数。默认情况下,该函数会返回结果变量的估计数值,并将其存储在名为 p.rpart 的向量中,代码如下:
p.rpart <- predict(m.rpart, wine_test)
对预测结果的摘要统计进行快速查看,发现预测值的范围比真实值要窄得多:
summary(p.rpart)
# Min. 1st Qu. Median Mean 3rd Qu. Max.
# 4.545 5.563 5.971 5.893 6.202 6.597
summary(wine_test$quality)
# Min. 1st Qu. Median Mean 3rd Qu. Max.
# 3.000 5.000 6.000 5.901 6.000 9.000
这表明模型未能正确识别极端情况,尤其是最好和最差的葡萄酒。不过,在第一和第三四分位数之间,模型可能表现良好。
1.1 相关性评估
预测值和实际质量值之间的相关性是衡量模型性能的一种简单方法。可以使用 cor() 函数来测量两个等长向量之间的关系:
c
超级会员免费看
订阅专栏 解锁全文
916

被折叠的 条评论
为什么被折叠?



