VOC数据集说明

VOC官网

 voc2007数据集下载

voc2012数据集下载 

在语义分割的标签文件,存放在SegmentationClass文件夹下,每张jpg的图片会对应一张单通道的png的mask图片。

包括背景,一共有21个类别,

{
	"background": 0,
    "aeroplane": 1,
    "bicycle": 2,
    "bird": 3,
    "boat": 4,
    "bottle": 5,
    "bus": 6,
    "car": 7,
    "cat": 8,
    "chair": 9,
    "cow": 10,
    "diningtable": 11,
    "dog": 12,
    "horse": 13,
    "motorbike": 14,
    "person": 15,
    "pottedplant": 16,
    "sheep": 17,
    "sofa": 18,
    "train": 19,
    "tvmonitor": 20
}

对SegmentationClass下的所有png的图片进行遍历,筛选出标签:

unique labels:[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 255]
length labels:22

其中包含255的类别,读入一张图片,将png中不同的label填充成不同的颜色,进行可视化

 

 

def show_png_unique():
    pngpath='VOCdevkit/VOC2007/SegmentationClass/2007_000063.png'
    mask=cv2.imread(pngpath,-1)
    height,width=mask.shape
    resbs=np.unique(mask)
    print(resbs)
    dict_colors={
        0:[  0, 250, 154],
        1:[255, 160, 122],
        2:[255,   0, 255],
        3:[210, 180, 140],
        4:[  0, 206, 209],
        5:[250, 240, 230],
        6:[47, 79, 79],
        7:[152, 251, 152],
        8:[255, 239, 213],
        9:[173, 255,  47],
        10:[ 60, 179, 113],
        11:[123, 104, 238],
        12:[160,  82,  45],
        13:[255,  69,   0],
        14:[  0, 255, 127],
        15:[ 32, 178, 170],
        16:[119, 136, 153],
        17:[139,   0, 139],
        18:[124, 252,   0],
        19:[ 75,   0, 130],
        20:[255, 215,   0],
        21:[123, 104, 238],
        255:[255,255,255],
    }
    
    img=np.zeros((height,width,3),dtype=np.uint8)
    for resb in resbs:
        img[mask==resb]=dict_colors[resb]
    cv2.imwrite("color_img.jpg",img)

结果图如上所示,可以看到目标的边缘全部是白色,也就是png图片中255的标签,所对应的区域,在训练的过程中,该区域会被屏蔽掉。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值