基于改进级联卷积神经网络的交通标志识别
摘要:首先,针对交通标志这类小目标特殊任务,将FPN模块的深层特征信息融合进浅层特征层。其次,改进了目标检测任务中的评价指标IoU,引入了目标检测任务的直接评价指标GIoU指导定位任务,提高了检测精度。GTSDB的mAP达98.8%。
存疑:
0.改进级联它是咋级联的? (图二给出答案)
1.将FPN模块的深层特征信息融合进浅层特征层(FPN是啥? ***(图三给出答案)***Faster-RCNN那个? (不对,那是RPN)深层特征信息融合进浅层特征层这又是啥? (大致是将顶层特征信息和底层特征信息融合))
2.GIoU为啥能提高检测精度? (IOU有问题,GIOU列了一大堆算式,说明他很顶)
图一:Faster-RCNN结构示意图

图二:级联RCNN示意图

图三:FPN网络示意结构图
图三这里存疑,不是很明白他是什么意思,下面两幅图是他作出的解释。看来需要去了解下图特征图像金字塔先。


论文中觉得,IOU作为定位回归的损失函数,存在以下问题,且其作为评价指标不是很合适,于是提出了GIOU,是将其作为代价函数以提高模型的定位能力。其实就相当于自己设置了一个Loss,给出了这个loss是怎么计算的,也给出了结果表明这个loss更好。


论文中值得学习的地方:前言部分到时候要这样写,简洁明了,然后对应的论文也要查来看看,单阶段:YOLOv3,SSD,Retinnnet,双阶段:RCNN,RFCN,Faster-RCNN,Cascade-RCNN。


该研究针对交通标志检测,结合FPN模块优化级联卷积神经网络,将深层特征信息融入浅层,提升特征融合效果。通过引入GIoU作为评价指标,改善了目标检测的定位精度,实验结果在GTSDB数据集上的mAP达到98.8%。此外,论文还对比了不同目标检测模型如YOLOv3、SSD、Faster-RCNN等。
1万+

被折叠的 条评论
为什么被折叠?



