要点:
- 常用数据集和标注工具
标注工具 PPOCRLabel github地址:paddleocrlabel
参考文档:目标检测简介 - 知乎
一 目标检测数据集
1. PASCAL VOC
VOC数据集是目标检测经常用的一个数据集,自2005年起每年举办一次比赛,最开始只有4类,到2007年扩充为20个类,共有两个常用的版本:2007和2012。学术界常用5k的train/val 2007和16k的train/val 2012作为训练集,test 2007作为测试集,用10k的train/val 2007+test 2007和16k的train/val 2012作为训练集,test2012作为测试集,分别汇报结果。
包含的种类:

数据集结构:

PASCAL VOC挑战赛 (The PASCAL Visual Object Classes )是一个世界级的计算机视觉挑战赛,PASCAL全称:Pattern Analysis, Statical Modeling and Computational Learning,是一个由欧盟资助的网络组织。PASCAL VOC挑战赛主要包括以下几类:图像分类(Object Classification),目标检测(Object Detection),目标分割(Object Segmentation),行为识别(Action Classification) 等。
2. MS COCO
COCO数据集是微软团队发布的一个可以用来图像recognition+segmentation+captioning 数据集,该数据集收集了大量包含常见物体的日常场景图片,并提供像素级的实例标注以更精确地评估检测和分割算法的效果,致力于推动场景理解的研究进展。依托这一数据集,每年举办一次比赛,现已涵盖检测、分割、关键点识别、注释等机器视觉的中心任务,是继ImageNet Challenge以来最有影响力的学术竞赛之一。

相比ImageNet,COCO更加偏好目标与其场景共同出现的图片,即non-iconic images。这样的图片能够反映视觉上的语义,更符合图像理解的任务要求。而相对的iconic images则更适合浅语义的图像分类等任务。
COCO的检测任务共含有80个类

文章介绍了几个常用的目标检测数据集,包括PASCALVOC和MSCOCO,以及它们的结构和使用方式。同时,提到了多个图像标注工具,如LabelImg、Labelme、Labelbox、RectLabel、CVAT和VIA,这些工具支持不同类型的标注任务,如分类、分割和目标检测。特别提到了PPOCRLabel,这是一个针对OCR领域的半自动化标注工具。
最低0.47元/天 解锁文章
7599

被折叠的 条评论
为什么被折叠?



