【目标检测】数据集格式&评价指标

数据集转换与评估指标

原创已于 2024-09-23 10:54:13 修改 · 712 阅读

CC 4.0 BY-SA版权

文章标签：

于 2024-06-25 21:31:08 首次发布

2 篇文章

订阅专栏

数据集格式&评价指标

从VOC格式转为COCO格式

首先运行 voc2coco.py 在 VOC 中生成 labels 和 images 文件夹
然后将 images 中的 train 目录下的图片放置到 train2017 中，将 val 目录下的图片放置到 val2017 中
最后运行 getcoco.py 根据 VOC 中 labels 下的 train/val 中的 xml，生成 annotations 中的instances_train2017.json / instances_val2017.json

	label 有框（positive）	label 无框（negative）
预测有框（positive）	TP （iou>0.5）	FP （iou<=0.5）（误检）
预测无框（negative）	FN（漏检）	TN（不考虑）

注意：

（查准率）Precision: 模型预测的所有框中，预测正确的比例。TP/（TP+FP）

（查全率）Recall: label的所有框中，模型预测正确的比例。TP/（TP+FN ）

AP： P-R 曲线下的面积

mAP： 各个类别的平均AP

先根据 iou_thr，确定所有detect_bbox 的 true/false 情况，并根据confidence进行排序
设定不同的confidence_thr，确定其TP， FP（假阳，误检）， FN（假阴，漏检）的数量，计算查准率和查全率（随着confidence_thr值设置得越小，模型输出bbox越多，查准率降低，查全率会提升）
根据不同confidence_thr下的查准率和查全率，画出PR曲线了（当多个rank的recall值相同时，只保留precision最大的那个rank），计算阴影面积即AP

关于AR指标：https://zhuanlan.zhihu.com/p/535794631