制作coco类型数据集_coco数据集制作-优快云博客

本文链接：https://blog.youkuaiyun.com/weixin_42398658/article/details/138943813

COCO格式数据集简介

COCO数据集是一个大型的、丰富的物体检测，分割和字幕数据集。这个数据集以scene understanding（场景理解）为目标，主要从复杂的日常场景中截取，图像中的目标通过精确的segmentation（分割）进行位置的标定。图像包括91类目标，328,000影像和2,500,000个label。是目前为止有语义分割的最大数据集，提供的类别有80类，有超过33万张图片，其中20万张有标注，整个数据集中个体的数目超过150万个。

LabelMe版（本地标注）

第一步：整理图片

根据需求按照自己喜欢的方式收集图片，图片中包含需要检测的信息即可，可以使用ImageNet格式数据集整理图片的方式对收集的图片进行预处理。

整理图片（目标检测）
|---images
    |----test
        |----xxx.jpg/png/....
    |----train
        |----xxx.jpg/png/....
    |----valid
        |----xxx.jpg/png/....

数据划分的方法并没有明确的规定，不过可以参考两个原则：