ROC曲线概念

ROC曲线(receiver operating characteristic curve),又称为感受性曲线(sensitivity curve)。得此名的原因在于曲线上各点反映着相同的感受性,它们都是对同一信号刺激的反应,只不过是在几种不同的判定标准下所得的结果而已。接受者操作特性曲线就是以虚惊概率为横轴,击中概率为纵轴所组成的坐标图,和被试在特定刺激条件下由于采用不同的判断标准得出的不同结果画出的曲线。

ROC曲线的属性

(1)β值的改变独立于d’的变化,考察β值变化对P(y/SN)和P(y/N)的影响时发现:当β接近0时,击中概率几乎为0,即信号全当成噪音接受;当β接近无穷大时,虚惊概率几乎为0,即噪音全当成信号接受;而当β从接近0向无穷大渐变的过程中,将形成一条完整地ROC曲线,曲线在某一处达到最佳的标准βOPT。(2)ROC曲线的曲率反应敏感性指标d’:对角线,代表P(y/SN)=P(y/N),即被试者的辨别力d’为0,ROC曲线离这条线愈远,表示被试者辨别力愈强,d’的值当然就愈大。由上可知,d’的变化使ROC曲线形成一个曲线簇,而β的变化体现在这一曲线簇中的某一条曲线上不同点的变化。此外,如果将ROC曲线的坐标轴变为Z分数坐标,我们将看到ROC曲线从曲线形态变为直线形态。这种坐标变换可以用来验证信号检测论一个重要假设,即方差齐性假设。

 

ROC曲线是显示Classification模型真正率和假正率之间折中的一种图形化方法。

解读ROC图的一些概念定义::

真正(True Positive , TP)被模型预测为正的正样本;
假负(False Negative , FN)被模型预测为负的正样本;
假正(False Positive , FP)被模型预测为正的负样本;
真负(True Negative , TN)被模型预测为负的负样本。

 

真正率(True Positive Rate , TPR)或灵敏度(sensitivity)
TPR = TP /(TP + FN)  (正样本预测结果数 / 正样本实际数)
假负率(False Negative Rate , FNR)
FNR = FN /(TP + FN) (被预测为负的正样本结果数 / 正样本实际数 )

假正率(False Positive Rate , FPR)
FPR = FP /(FP + TN) (被预测为正的负样本结果数 /负样本实际数)
真负率(True Negative Rate , TNR)或特指度(specificity)
TNR = TN /(TN + FP) (负样本预测结果数 / 负样本实际数)

目标属性的被选中的那个期望值称作是“正”(positive)

 

ROC曲线上几个关键点的解释:

( TPR=0,FPR=0 ) 把每个实例都预测为负类的模型
( TPR=1,FPR=1 ) 把每个实例都预测为正类的模型
( TPR=1,FPR=0 ) 理想模型

 

一个好的分类模型应该尽可能靠近图形的左上角,而一个随机猜测模型应位于连接点(TPR=0,FPR=0)和(TPR=1,FPR=1)的主对角线上。

ROC曲线下方的面积(Area Under the ROC Curve, AUC)提供了评价模型平均性能的另一种方法。如果模型是完美的,那么它的AUC = 1,如果模型是个简单的随机猜测模型,那么它的AUC = 0.5,如果一个模型好于另一个,则它的曲线下方面积相对较大



### ROC曲线与PR曲线概念 #### ROC曲线概念 ROC曲线是由一系列阈值下(伪阳性率,真阳性率)构成的一系列坐标点连接而成的形[^3]。该曲线位于二维坐标系中,其中横轴代表假正类率(FPR),即 \( FPR = 1 - TNR \) 或者说 \( 1 - Specificity \);而纵轴则表示真正类率(TPR),也被称为敏感度(Sensitivity)或者召回率(Recall)。 #### PR曲线概念 PR曲线同样基于不同的决策阈值绘制,在此情况下关注的是精确率(Precision)和召回率(Recall)之间的关系。对于每一个可能的分类置信度阈值,可以计算出一组对应的Precision和Recall值并以此来构建这条曲线[^2]。 ### 曲线间的区别 主要体现在以下几个方面: - **衡量标准的不同** - 对于ROC而言,其考量的是FPR与TPR的变化趋势; - 而PR更侧重于Precision相对于Recall的表现情况。 - **适用范围上的差异** - 当数据集类别分布较为均衡时,两者都能很好地反映模型性能; - 若遇到极端不平衡的数据集,则PR往往能提供更加直观有效的评价视角,因为此时高比例的负样本可能导致极低的FPR即使在大量误报的情况下也能保持较低水平,从而使得ROC曲线下面积(AUC)显得过高估计了模型的真实效能。 - **视觉表现形式** - ROC通常会有一个固定的起点(0,0)和终点(1,1),并且理想状态下应该尽可能向左上方弯曲接近完美分类器的位置; - 反之,PR曲线不会固定经过特定位置,并且当存在较多噪声或难以区分的例子时可能会呈现出复杂的形态变化[^1]。 ### 应用场景的选择依据 选择使用哪种类型的表取决于具体的应用背景和个人偏好: - 如果希望获得一个不受类别先验概率影响的整体性能概览,那么可以选择查看AUC-ROC作为参考指标之一; - 在面对高度偏斜的数据集或是特别关心减少错误肯定案例数量的情形下,PR能够更好地突出那些能够在维持较高查准率的同时达到良好覆盖能力的算法版本。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值