从城市场景语义分割数据集中划分出自动驾驶领域道路分割数据集类别中遇到的问题

博主在处理多个计算机视觉数据集(Apolloscape、Camvid、Cityscape、UAS、Mapillary)时遇到标注不准确、缺失、解析困难等问题,如草地误标、边缘不规则、缺少特定类标注(如减速带)等。对于Mapillary数据集的解析,博主提出了一种基于颜色图的方法,但存在误选和效率低下的问题,并寻求更快的转换方案。此外,还讨论了不同数据集的处理难度和遇到的共性问题。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1. 【Apolloscape】

边缘:在处理Apolloscape时,发现Apolloscape数据集的标注不太准确,部分草地被错误的分到了road这一类(成散射状,不是规则闭合区域)。

数据:label中存在部分的NoneType,在读取的时候报错,删掉出现NoneType的label之后再去掉没有label的image发现最后剩余的数据只有13w多。有部分image图中间有一条白色线条缺失像素,不知道是我下载的时候破损了还是官方给出的就是这样的。

2. 【Camvid】

同样,在处理Camvid数据集时,road类别+交通线条组成的区域中有离散点的缺失,边缘不规则。

3. 【Cityscape】

数据集下载完毕解压后分为train val test部分,绘制test部分的road的时候发现没有,解析对应的mask并使用np.unique读取后只有013这几个数字(我用PIL读了一两张图,原图中存在road,mask中却没有这部分的标注)。

4. UAS

UAS数据集中关于减速带没有标注出来

5.Mapillary

这也是最好的最精确的一个数据集,但是解析很麻烦我不知道有没有更好的处理方式,如果有欢迎留言交流。

我是用label的1.2版本的颜色图解析的,作者给的color是RGB顺序,如果是cv2读取,需要改为BGR顺序。

假如给出的road类color为[1,2,3]

第一个通道找label的第一个通道等于1的index,使用这个index修改mask对应坐标的值;

第二个通道也是这样找的,找等于2的

第三个通道找等于3的index

但是这样存在一个问题,假如另外不需要的类别的color是[4,2,3],那么找到的第二个第三个通道的index就会超出我需要的,。发现这个问题后重新对三个通道求交集,最终可以筛选到需要的类别并得到mask。

有两个缺点:

  1. 很多在人行横道上的地标线和井盖也会被选中为road(因为我把线和井盖等都加进去了)

  2. 单张图片处理时间很长。耗费时间很慢,但是instances和panoptic好像更加难以处理?大家有没有找到比较好的mapillary2coco的代码呢?

后续遇到数据集再更新
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值