14、机器学习分类器性能评估与统计检验方法详解

机器学习分类器性能评估与统计检验方法详解

1. 性能估计基础

在监督分类问题中,核心目标是构建一个既能准确描述训练数据,又能对来自相同分布的未知数据进行有效泛化的分类模型。然而,联合概率分布 $p(x,c)$ 通常是未知的,因此需要从现有的数据集 $D = {(x_1,c_1), … ,(x_N,c_N)}$ 来估计分类器在未知实例上的性能。

1.1 AUC 计算

在多分类问题中,AUC(Area Under the Curve)的计算更为复杂。对于二分类问题,可直接从图中计算 AUC,例如:
$AUC(\varphi) = 0.20·0.20 + 0.20·0.60 + 0.20·0.80 + 0.40·1 = 0.72$

在多分类问题中,AUC 可以推广为 ROC 曲面下的体积,或者是所有可能的二分类 ROC 曲线的平均 AUC。计算公式为:
$AUC_{multi - class}(\varphi) = \frac{2}{R(R - 1)} \sum_{c_i,c_j \in \Omega_C, c_i \neq c_j} AUC_{c_i,c_j}(\varphi)$
其中,$AUC_{multi - class}(\varphi)$ 是分类器 $\varphi$ 的多分类 ROC 的总 AUC,$AUC_{c_i,c_j}(\varphi)$ 是 $\varphi$ 对于类 $c_i$ 和 $c_j$ 的二分类 ROC 曲线的 AUC。

1.2 诚实性能估计方法分类

诚实性能估计方法根据重采样特征分为单重采样和多重采样两类。单重采样方法只对数据集进行一次采样,而多重采样方法

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值