机器学习中的监督与无监督学习方法
1. 监督学习方法
监督学习在许多领域都有广泛应用,如信用卡违约检测、薪资确定、图像分类和股票市场预测等。下面将详细介绍几种常见的监督学习算法。
1.1 决策树
决策树是一种具有可解释性解决方案模型的启发式方法,可分为回归树和分类树。
- 回归树剪枝 :以一个复杂决策树为例,通过以下代码进行后剪枝操作:
dtp <- prune(dt, cp=0.058)
fancyRpartPlot(dtp, sub="DT – pruned")
y = H$Price[-I]; yh = predict(dtp, newdata = H[-I,])
cat("Regression tree: ", derr(y,yh))
剪枝后的平均绝对百分比误差(MAPE)为 9.66%(树大小为 4),相比之前的 8.46%(树大小为 8)略有增加。此外,还可以进行预剪枝,通过向 rpart 函数提供控制参数,如 minbucket (叶节点的最小观测数)、 minsplit (进行分裂的最小观测数)等。
- 分类树 :以泰坦尼克号数据集为例,展示分类树的使用方法。
- 简单决策树 :使用
Survived ~ Sex绘制简单决策树
- 简单决策树 :使用
超级会员免费看
订阅专栏 解锁全文


被折叠的 条评论
为什么被折叠?



