常见指标 Iou,dice,accuracy,recall,sensitivity,precision,F1-score,specificity 图解以及计算代码

原创

已于 2024-03-21 09:35:47 修改 · 1.3w 阅读

111 ·

CC 4.0 BY-SA版权

文章标签：

#python #神经网络 #深度学习 #人工智能

于 2022-11-20 13:42:44 首次发布

本文详细介绍了图像分割任务中常见的性能评价指标，包括IOU、Dice系数、F1-score等，并提供了具体的计算方法及Python代码实现。

常见指标计算

指标解释
代码计算

指标解释

开始之前需要了解混淆矩阵的知识。另外我还在公式中添加了1e-7作为分子。原因为了避免代码中出现分子为0的情况。本次介绍时，直接写到公式里面。

混淆矩阵如图，如何看呢？在进行图像分割时
比如某个像素点，我们预测为类别P ，真实情况是类别P。那么这个像素点的情况就是“一个预测正确的P”，记为TP （True Positive）
比如某个像素点，我们预测为类别P ，真实情况是类别N。那么这个像素点的情况就是“一个预测错误的P”，记为FP （False Positive）
其他（FN，TN）同理。

将混淆矩阵放到真实图像中，就是这样的情况。
如图是一张图片的情况，GT就是我们数据集图片标注的区域，predict就是我们模型预测出的区域。

predict与GT一定存在差异，这些差异需要依靠评价指标来衡量。不同的评价指标对不同方向的差异有不同侧重点。
下面介绍评价指标：

IOU，Jaccard index

IOU(Intersection over Union)即交并比，顾名思义，即交集与并集的比值。在图像分割中，我们就计算 GT，Predict的交集与并集的比值。

很多论文还会说的杰卡德指数（Jaccard index），其实就是交并比。

混淆矩阵	公式	公式图解

Dice coefficient，F1-score

网上有很多关于这两个指标的计算，其实就是同一个计算（不服请推导）。

F1-score是为了能够评价不同算法的优劣，在Precision和Recall的基础上提出了F1值的概念，来对Precision和Recall进行整体评价。F1-score（均衡平均数）是综合考虑了模型查准率和查全率的计算结果，取值更偏向于取值较小的那个指标。F1的定义如下：

Dice 系数，也称为 F1 分数，是两个集合之间重叠的度量，范围为 0 到 1。值为 1 表示完全重叠，而 0 表示没有重叠。
dice损失，和dice系数（dice coefficient）的关系是：dice loss = 1-dice coefficient。
这个指标很常见，用的频次比 IOU 还多，主要有：

Dice 系数广泛用于评估图像分割模型的性能，因此使用 Dice 损失有助于优化该指标的模型
Dice 损失可以处理类别不平衡，这通常是医学图像分割中的一个问题，其中某些类别可能比其他类别更普遍。
Dice 损失是可微的，这使得它可以与基于梯度的优化算法结合使用。

混淆矩阵	公式	公式图解

Accuracy

accuracy指的是正确预测的样本数占总预测样本数的比值，它不考虑预测的样本是正例还是负例。如果在代码中只考虑正样本，可以在公式中去掉分子tn。

混淆矩阵	公式	公式图解

最低0.47元/天解锁文章

11 条评论

but why 2024.07.20
我计算的dice和f1值完全一样正常吗

拙手繪蓝天。。 2023.12.11
博主，你好，我用Unet分割得到了可视化的分割图像，怎么转化为mask图一样的格式？
- 六和七回复拙手繪蓝天。。 2023.12.11
  找到绘制可视化的代码处，将其输出二值图单独保存为图片

AXYY 2023.10.24
作者你好，请问我在我的数据上进行测验时，那个acc和spec接近1，但是其他结果正常，比如iou平均0.75，dice平均0.84，这是什么情况
- 六和七回复AXYY 2023.10.24
  你模型效果，应该很好了可能情况，你自己排除一下：情况一：代码错误情况二：被分割的区域正负样本存在严重不均衡。举个例子，我在中华大地上，分割出不属于我脚底的面积。这种情况，我就将全中国都划为不属于我脚底的面积，准确率 ACC 就接近 1。有没有将我的脚底面积分割出来，ACC都极为接近1。推荐 mIOU 指标。

风生哇呀呀呀 2023.10.20
请问有没有参考文献呀
- 六和七回复风生哇呀呀呀 2023.10.21
  现在很多图像分割论文都有对这些指标的解释章节。多看几篇论文就能收集到全部常见指标的解释。举例参考： DUCKNET---模型指标章节：https://www.nature.com/articles/s41598-023-36940-5

光183 2023.07.20
为什么算出来图片的precision和recall均值是一样的？这正常吗作者大大
- 六和七回复光183 2023.08.02
  precision是所有所有预测结果中预测正确的比例 recall是所有正样本中被预测出来的比例多尝试预测几个不同例子，如果几个precision和recall都一样，除非精度100%，否则这不太可能