ROC评估曲线的坑

ROC曲线是评估模型性能的重要工具,涉及到True Positives, False Positives, True Negatives, 和 False Negatives等关键指标。文章介绍了TPR(真正率)、FPR(假正率)及其相关概念,并探讨了误识率与误拒率,指出它们与ROC曲线的关系。通过排序样本概率并设定阈值,可以得到不同点构成的ROC曲线,AUC则用于量化模型好坏。同时,文章提到了ROC曲线的不同表示方法和如何在MATLAB中绘制。" 111882349,10295422,理解欧拉角与万向节死锁,"['欧拉角死锁', '三维空间', '飞行控制']

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Roc曲线有多种算法,但先普及几个基本概念:
True positives (TP) = 被模型预测为正的正样本
True negatives (TN) = 被模型预测为负的负样本
False positives (FP) = 被模型预测为正的负样本
False negatives (FN) = 被模型预测为负的正样本

TPR=TP/(TP+TN) 预测为正确的正样本的概率

FPR=FR/(FR+FN) 预测为正确的负样本的概率

TNR=TN/(TN+TP) 预测为错误的正样本的概率

FNR=FN/(FN+FR) 预测为错误的负样本的概率

仔细想很容易,用起来很烧脑(可能是自己傻吧。。)

///新添加////////////////////////////////////////////////////////////////////
误识与误拒
对于一个阈值,误识是大于这个阈值的类间数。误拒是小于这个阈值的类内数。
误识率与误拒率
误识率==误识数/类间总数
误拒率==误拒数/类内总数
误识率与误拒率画出的曲线是负相关。
ROC曲线为误识率(x轴)、误拒率(y轴)。
///////////////////////////////////////////////////////////////////////////////

ROC曲线需要的数据获取方式
我们根据每个测试样本属于正样本的概率值从大到小排序。我们从高到低,依次将每个概率值作为阈值threshold,当测试样本属于正样本的概率大于或等于这个threshold时,我们认为它为正样本,否则为负样本。
每次选取一个不同的threshold,我们就可以得到一组FPR和TPR,即ROC曲线上的一点。
然后将所有的threshold的值所对应的FPR和TPR按顺序画出来==ROC曲线
(统计方法:最好对检测的正样本和负样本分别做概率直方图)

ROC画法一 <

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值