学习参考UP主 我是土堆
文章目录
1. 目标检测含义
目标检测:位置+类别
主流的目标检测:矩阵框形式输出
精度更高:
语义分割:区别类别
实例分割:区别个体
2. 数据集
2.1 VOC数据集
2.1.1 数据集下载
方法一:官网下载
VOC数据集官网
2007和2012比较常用
打开某一年的文件,找到Development Kit
方法二:pytorch下载
pytorch官网上查看想要的数据集
具体方法见6.1下载数据集
2.1.2 数据集说明
图片在线查看工具
https://www.gifgit.com/image/rectangle-tool
VOC数据集说明:
Annotations:包含了xmI文件,描述了图片的各种信
息,特别是目标的位置坐标,左上角坐标和右下角坐标
ImageSets:主要关注Main文件夹的内容,里面的文
件包含了不同类别目标的训练/验证数据集图片名称
JPEGImages:原图片
SegmentationClass/Object:用于语义分割
2.2 COCO数据集
2.2.1 数据集下载
COCO数据集官网
常用数据集是2017
训练集train2017
训练集train2017:http://images.cocodataset.org/zips/train2017.zip
训练集标注train2017 annotations:http://images.cocodataset.org/annotations/annotations_trainval2017.zip
验证集val2017
val2017:http://images.cocodataset.org/zips/val2017.zip
val2017 annotations:http://images.cocodataset.org/annotations/stuff_annotations_trainval2017.zip
测试集test2017
test2017:http://images.cocodataset.org/zips/test2017.zip
test2017 info:http://images.cocodataset.org/annotations/image_info_test2017.zip
2.2.2 数据集说明
Annotations:包含了json文件,描述了图片的各种信
息
将json文件拖入pycharm界面,按两下shift,选择Actions,搜索Reformats Code,点击后格式就清晰了
重要信息如下:
1)图片部分
id与标注部分image id一致
images[
{
"id”: 242287
"license":4,
"coco url":"http://images.cocodataset.org/val2017/088008242287 .jpg",
"flickr url":
"http://farm3.staticflickr.com/2626/4072194513 edbбacfb2b z.jpg"
"width"