1. 真阳性(TP):诊断为有,实际上也有高血压。
2. 伪阳性(FP):诊断为有,实际却没有高血压。
3. 真阴性(TN):诊断为没有,实际上也没有高血压。N阴性,p阳性
4. 伪阴性(FN):诊断为没有,实际却有高血压:后面字母是诊断的结果,T和F表示诊断对错
阳性似然比为真阳性率与假阳性率之比,即等于TPF/FPF;约登(Youden)指数为真阳性率与假阳性率之差,即等于TPF-FPF。一般选择阳性似然比或约登指数最大者为最佳工作点
Sensitivity 和 specificity
真阳性率TPR(确实有病)sensitivity灵敏度=真阳性人数/(真阳性人数+假阴性人数)*100%。正确判断病人的率;TPR=TP/(TP+FN)
假阳性率FPR(确实没病)specificity特异度=真阴性人数/(真阴性人数+假阳性人数))*100%。正确判断非病人的率;FPR=TN/(FP+TN)
TPR ( 真正例率 ):TPR=TP/(TP+FN) # 真正 /(正类别):正类别中预测对的个数
FPR ( 假正例率 ):FPR=FP/(TN+FP)#假正 /(负类别):负类别中预测错误的个数
ROC曲线
ROC分析可用于医学决策评价。自从八十年代起该方法广泛用于医学诊断性能的评价,如用于诊断放射学、实验室医学、癌症的筛选和精神病的诊断,尤其是医学影像诊断准确性的
理论上,完善的诊断有TPF(真阳性率)=1 ,FPF(假阳性率)=0,图中表现为ROC曲线从原点垂直上升到图的左上角,然后水平到达右上角。完全无价值的诊断有TPF=FPF,是一条从原点到右上角的对角线。一般ROC 曲线位于正方形的上三角。
ROC曲线是以真阳性率(灵敏度)为纵坐标,假阳性率(特异度)为横坐标绘制的曲线;离左上角越近的点预测(诊断)准确率越高。离右下角越近的点,预测越不准
ROC 曲线:纵轴为 TRP,横轴为 FPR,ROC 曲线围住的面积称为 AUC,AUC 越大则学习器性能越好。
曲线下面积(AUC)
AUC值越大的分类器,正确率越高。
AUC = 1,是完美分类器,采用这个预测模型时,存在至少一个阈值能得出完美预测。绝大多数预测的场合,不存在完美分类器。
0.5 < AUC < 1,优于随机猜测。这个分类器(模型)妥善设定阈值的话,能有预测价值。
AUC = 0.5,跟随机猜测一样(例:丢铜板),模型没有预测价值。
AUC < 0.5,比随机猜测还差;但只要总是反预测而行,就优于随机猜测。
Precision 和Recall:精确率和召回率
Precision ( 精确度/查准率 ):P=TP/(TP+FP) # 真正 /(预测正):预测正中对的几个
Recall ( 召回率/查全率 ):R=TP/(TP+FN) #真正 /(正类别):正的找回几个
F1 度量:2RP/(R+P):精确率和召回率的调和均值。
PR 曲线:纵轴为 Precision,横轴为 Recall