深度学习_pytorch目标检测笔记

WMX1012

于 2024-12-20 17:49:25 发布

阅读量811

点赞数 26

分类专栏：深度学习文章标签：深度学习 pytorch 目标检测

本文链接：https://blog.youkuaiyun.com/WMX1012/article/details/144352145

版权

学习参考UP主我是土堆

文章目录

1. 目标检测含义
2. 数据集
3. 加载数据集
- 3.1 pytorch查看COCO数据集
- 3.2 Pytorch读取自己标注的数据集

1. 目标检测含义

目标检测：位置+类别
主流的目标检测：矩阵框形式输出
在这里插入图片描述
精度更高：
语义分割：区别类别
实例分割：区别个体

2. 数据集

2.1 VOC数据集

2.1.1 数据集下载

方法一：官网下载
VOC数据集官网
2007和2012比较常用
在这里插入图片描述
打开某一年的文件，找到Development Kit

方法二：pytorch下载
pytorch官网上查看想要的数据集
具体方法见6.1下载数据集

2.1.2 数据集说明

图片在线查看工具
https://www.gifgit.com/image/rectangle-tool

VOC数据集说明：
Annotations：包含了xmI文件，描述了图片的各种信
息，特别是目标的位置坐标，左上角坐标和右下角坐标
ImageSets：主要关注Main文件夹的内容，里面的文
件包含了不同类别目标的训练/验证数据集图片名称
JPEGImages：原图片
SegmentationClass/Object：用于语义分割

2.2 COCO数据集

2.2.1 数据集下载

COCO数据集官网
常用数据集是2017

训练集train2017
训练集train2017：http://images.cocodataset.org/zips/train2017.zip
训练集标注train2017 annotations：http://images.cocodataset.org/annotations/annotations_trainval2017.zip

验证集val2017
val2017：http://images.cocodataset.org/zips/val2017.zip
val2017 annotations：http://images.cocodataset.org/annotations/stuff_annotations_trainval2017.zip

测试集test2017
test2017：http://images.cocodataset.org/zips/test2017.zip
test2017 info：http://images.cocodataset.org/annotations/image_info_test2017.zip

2.2.2 数据集说明

Annotations：包含了json文件，描述了图片的各种信
息
将json文件拖入pycharm界面，按两下shift，选择Actions，搜索Reformats Code，点击后格式就清晰了

重要信息如下：
1）图片部分
id与标注部分image id一致

images[
{
   "id”: 242287
"license":4，
"coco url":"http://images.cocodataset.org/val2017/088008242287 .jpg",
"flickr url":
"http://farm3.staticflickr.com/2626/4072194513 edbбacfb2b z.jpg"
"width"

最低0.47元/天解锁文章