本文简要概括VOS任务中两个最重要的评价指标,即J&F(全称应该是Jaccard和F-Score)。其中J描述的是预测的mask和gt之间的IOU,F描述的是预测mask边界与gt边界之间的吻合程度。下面分别进行介绍:
Jaccard
J的计算其实非常简单,就是单纯的计算预测mask和gt mask之间的IOU,即一个比值的形式:分子是预测mask和gt这两张图foreground部分的交,而分母部分就是两者之间的并集。其代码实现如下:
def db_eval_iou(annotation,segmentation):
""" Compute region similarity as the Jaccard Index.
Arguments:
annotation (ndarray): binary annotation map.
segmentation (ndarray): binary segmentation map.
Return:
jaccard (float): region similarity
"""
annotation = annotation.astype(np.bool)
segmentation = segmentation.astype(np.bool)
if np.isclose(np.sum(annotation),0) and np.isclose(np.sum(segmentation),0):
return 1
else:
return np.sum((annotation & segmentation)) / \
np.sum((annotation | segmentation),dtype=np.float32)
F-score
F-score评估的是预测mask的边界是否与gt mask的边界对应。首先应提取预测mask和gt的边界元素坐标,将边界上的元素置为True,非边界的元素置为False。由于F-score的定义为:
F=2PRP+RF=\frac{2PR}{P+R}F=P+R2PR
P表示precision,即查准率;R表示recall,即查全率。其计算公式分别如下:
P=TPTP+FPP=\frac{TP}{TP+FP}P

本文深入探讨视频目标分割(VOS)任务中的两大核心评价标准:Jaccard指数(J)和F-score。J用于衡量预测mask与真实mask的重叠程度,而F-score则评估预测边界与真实边界的一致性,通过查准率(P)和查全率(R)的平衡,全面反映分割精度。
最低0.47元/天 解锁文章
80

被折叠的 条评论
为什么被折叠?



