精准的道路车辆检测方法解析
1. 全卷积网络基础
在车辆检测中,全卷积网络(FCN)展现出了独特的优势。对于输出像素 $(x_o, y_o)$ 对应的窗口区域,可由以下公式确定:
[
\begin{cases}
x_{min} = x_oStr \
x_{max} = x_oStr + S_1 \
y_{min} = y_oStr \
y_{max} = y_oStr + S_1
\end{cases}
]
其中,$S_1$ 为相关参数,$Str$ 为步长。与传统的滑动窗口方法不同,FCN 能够自然地共享不同重叠区域的计算,避免了为每个窗口重复计算整个流程,从而提高了效率。在测试时,对任意大小的输入图像采用自下而上的卷积方式,使得相邻窗口的公共计算只需进行一次。基于此,我们可以将输出图中车辆置信度高的像素映射回输入图像中对应的边界框,这些边界框很可能包含车辆。
2. 网络训练
为了实现车辆检测,我们采用公开的 VGG - 16 层模型作为预训练模型,并在车辆检测数据集上进行微调。具体操作如下:
- 模型调整 :将 VGG - 16 网络中的两个全连接层替换为两个 $1×1$ 卷积核的卷积层,以满足全卷积网络的要求。由于 ILSVRC 分类任务有 1000 个类别,VGG - 16 的最后一个全连接层有 1000 个神经元,而我们的车辆检测任务只有车辆和非车辆两个类别,因此将最后一层替换为具有 2 个输出神经元的 $1×1$ 卷积层。
- 损失函数 :微调过程中优化的损失函数为交叉熵损失,公式为
全卷积网络车辆检测方法
超级会员免费看
订阅专栏 解锁全文
525

被折叠的 条评论
为什么被折叠?



