1. 【Apolloscape】
边缘:在处理Apolloscape时,发现Apolloscape数据集的标注不太准确,部分草地被错误的分到了road这一类(成散射状,不是规则闭合区域)。
数据:label中存在部分的NoneType,在读取的时候报错,删掉出现NoneType的label之后再去掉没有label的image发现最后剩余的数据只有13w多。有部分image图中间有一条白色线条缺失像素,不知道是我下载的时候破损了还是官方给出的就是这样的。
2. 【Camvid】
同样,在处理Camvid数据集时,road类别+交通线条组成的区域中有离散点的缺失,边缘不规则。
3. 【Cityscape】
数据集下载完毕解压后分为train val test部分,绘制test部分的road的时候发现没有,解析对应的mask并使用np.unique读取后只有013这几个数字(我用PIL读了一两张图,原图中存在road,mask中却没有这部分的标注)。
4. UAS
UAS数据集中关于减速带没有标注出来
5.Mapillary
这也是最好的最精确的一个数据集,但是解析很麻烦我不知道有没有更好的处理方式,如果有欢迎留言交流。
我是用label的1.2版本的颜色图解析的,作者给的color是RGB顺序,如果是cv2读取,需要改为BGR顺序。
假如给出的road类color为[1,2,3]
第一个通道找label的第一个通道等于1的index,使用这个index修改mask对应坐标的值;
第二个通道也是这样找的,找等于2的
第三个通道找等于3的index
但是这样存在一个问题,假如另外不需要的类别的color是[4,2,3],那么找到的第二个第三个通道的index就会超出我需要的,。发现这个问题后重新对三个通道求交集,最终可以筛选到需要的类别并得到mask。
有两个缺点:
-
很多在人行横道上的地标线和井盖也会被选中为road(因为我把线和井盖等都加进去了)
-
单张图片处理时间很长。耗费时间很慢,但是instances和panoptic好像更加难以处理?大家有没有找到比较好的mapillary2coco的代码呢?