大数据、物联网与机器学习在生物医学和健康信息学中的应用
1. 机器学习评估指标
1.1 准确率(Accuracy)
准确率被定义为一组不同类型预测中准确预测的总数。其计算公式为:
[Accuracy = \frac{TP + TN}{TP + TN + FP + FN}]
其中,TP 为真正例,TN 为真反例,FP 为假正例,FN 为假反例。
1.2 阳性预测值(PPV)和阴性预测值(NPV)
阳性预测值是诊断测试和统计领域中实际为真正阳性结果的阳性结果比例;阴性预测值则是这些领域中实际为真阴性结果的阴性结果比例。二者用于描述统计测量或任何诊断测试的真实性能。
1.3 误报率(False Alarm Rate)
当来自设备故障部分、雷达内部或外部源的噪声或其他信号超过预定义的检测阈值水平时,就会产生误报率。它可以表现为音频信号、数字信号处理器的输出或阴极射线管(CRT)上的亮点。如果阈值很低,会有大量误报;如果阈值很高,误报总数则很低。
1.4 受试者工作特征曲线(ROC Curve)
该曲线用于描述分类器系统的诊断能力,其中检测阈值始终是变化的。它准确地绘制了不同阈值设置下的真正例率(TPR)与假正例率(FPR)的关系。
1.5 ROC 曲线下面积(AUC)
该曲线用于描述基于所有分类阈值的总体性能的综合测量,范围在 0 到 1 之间。AUC 用于衡量特定模型预测的质量,而无需精确考虑选择的阈值类型,也用于衡量良好的预测。当模型的预测 100% 错误时,AUC 值为 0.0;当模型的预测 100% 正
超级会员免费看
订阅专栏 解锁全文
51

被折叠的 条评论
为什么被折叠?



