机器学习模型的 R 语言实现
1. k - 近邻(k - NN)模型
1.1 基本实现
使用 k - NN 模型对数据进行分类,以下是基本的 R 代码:
knn.pred <- knn(train=mydata.train, test=mydata.test,
cl=mydata.train.labels, k=3)
knn.pred[1:9]
sum(knn.pred == mydata.test.labels)
运行上述代码后, knn.pred[1:9] 的输出为 [1] H J M M J M M J M , sum(knn.pred == mydata.test.labels) 的输出为 [1] 8 ,这表示有 8 个正确的分类。
1.2 模型优化
可以通过以下两种方式对 k - NN 模型进行优化:
- 限制预测变量数量 :只考虑三个预测变量,如 by 、 upon 和 would 。
aRange <- c(2, 3, 5)
knn.pred <- knn(train=mydata.train[,aRange],
test=
超级会员免费看
订阅专栏 解锁全文


被折叠的 条评论
为什么被折叠?



