21、分类与假设检验相关知识解析

分类与假设检验相关知识解析

分类方法概述

分类问题通常需要监督学习,每个数据点都与一个标签相关联,且标签仅提供分类信息,并非数值。常见的分类方法有朴素贝叶斯分类器、线性判别分析、k近邻分类、逻辑回归、支持向量机和决策树等。尽管这些方法都用于数据分类,但它们的工作机制差异较大。

  • 各分类方法机制
    • 朴素贝叶斯分类器、线性判别分析、逻辑回归和k近邻分类学习条件概率分布。
    • 支持向量机解决一个优化问题,通过超平面优化数据点的正则化分离。
    • 决策树是一种非参数过程,将分类问题分解为独立的(线性)决策规则。
决策树相关操作
决策树复杂度选择

使用不同的复杂度参数(如 cpfig = 0.074 cptab = 0.042 )会得到不同的决策树,正确的值通常在表中给出,例如在某个例子中,最优复杂度值 cp∗ = 0.042

决策树剪枝

决策树构建的最后一步是在选定的复杂度水平上进行剪枝。在R中,可以使用 prune() 函数完成。剪枝后的决策树如图9.17所示,该树进行了三次分割,与“cptable”中显示的一致。需要注意的是,应始终检查剪枝结果是否符合期望的树复杂度。

graph LR
    A[构建完整决策树] --
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值