14、机器学习分类器性能评估与统计检验方法详解

root9

于 2025-08-29 14:34:30 发布

阅读量28

点赞数

CC 4.0 BY-SA版权

分类专栏：数据驱动神经科学文章标签：机器学习分类器性能评估统计检验

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/root9/article/details/152344915

数据驱动神经科学专栏收录该内容

47 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

机器学习分类器性能评估与统计检验方法详解

1. 性能估计基础

在监督分类问题中，核心目标是构建一个既能准确描述训练数据，又能对来自相同分布的未知数据进行有效泛化的分类模型。然而，联合概率分布 $p(x,c)$ 通常是未知的，因此需要从现有的数据集 $D = {(x_1,c_1), … ,(x_N,c_N)}$ 来估计分类器在未知实例上的性能。

1.1 AUC 计算

在多分类问题中，AUC（Area Under the Curve）的计算更为复杂。对于二分类问题，可直接从图中计算 AUC，例如：
$AUC(\varphi) = 0.20·0.20 + 0.20·0.60 + 0.20·0.80 + 0.40·1 = 0.72$

在多分类问题中，AUC 可以推广为 ROC 曲面下的体积，或者是所有可能的二分类 ROC 曲线的平均 AUC。计算公式为：
$AUC_{multi - class}(\varphi) = \frac{2}{R(R - 1)} \sum_{c_i,c_j \in \Omega_C, c_i \neq c_j} AUC_{c_i,c_j}(\varphi)$
其中，$AUC_{multi - class}(\varphi)$ 是分类器 $\varphi$ 的多分类 ROC 的总 AUC，$AUC_{c_i,c_j}(\varphi)$ 是 $\varphi$ 对于类 $c_i$ 和 $c_j$ 的二分类 ROC 曲线的 AUC。

1.2 诚实性能估计方法分类

诚实性能估计方法根据重采样特征分为单重采样和多重采样两类。单重采样方法只对数据集进行一次采样，而多重采样方法

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符 | 博主筛选后可见

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。