分类与假设检验相关知识解析
分类方法概述
分类问题通常需要监督学习,每个数据点都与一个标签相关联,且标签仅提供分类信息,并非数值。常见的分类方法有朴素贝叶斯分类器、线性判别分析、k近邻分类、逻辑回归、支持向量机和决策树等。尽管这些方法都用于数据分类,但它们的工作机制差异较大。
- 各分类方法机制
- 朴素贝叶斯分类器、线性判别分析、逻辑回归和k近邻分类学习条件概率分布。
- 支持向量机解决一个优化问题,通过超平面优化数据点的正则化分离。
- 决策树是一种非参数过程,将分类问题分解为独立的(线性)决策规则。
决策树相关操作
决策树复杂度选择
使用不同的复杂度参数(如 cpfig = 0.074 和 cptab = 0.042 )会得到不同的决策树,正确的值通常在表中给出,例如在某个例子中,最优复杂度值 cp∗ = 0.042 。
决策树剪枝
决策树构建的最后一步是在选定的复杂度水平上进行剪枝。在R中,可以使用 prune() 函数完成。剪枝后的决策树如图9.17所示,该树进行了三次分割,与“cptable”中显示的一致。需要注意的是,应始终检查剪枝结果是否符合期望的树复杂度。
graph LR
A[构建完整决策树] --
超级会员免费看
订阅专栏 解锁全文
738

被折叠的 条评论
为什么被折叠?



