Stream Query Denoising for Vectorized HD Map Construction

最新推荐文章于 2025-12-02 15:02:30 发布

原创最新推荐文章于 2025-12-02 15:02:30 发布 · 1k 阅读

15 ·

CC 4.0 BY-SA版权

文章标签：

#自动驾驶 #计算机视觉

BEV Perception 同时被 2 个专栏收录

56 篇文章

订阅专栏

Lane Detection

29 篇文章

订阅专栏

本文介绍了一种基于StreamMapNet的方法，通过参考DN-DETR的去噪技术，为局部地图感知设计了一种动态加噪和去噪机制。文章详细描述了噪声生成过程，包括使用前一帧GT的ChamferDistance确定匹配，以及自适应阈值的选择。实验结果显示在Nuscenes数据集上，这种方法提高了感知稳定性并与其他算法进行了性能对比。

部署运行你感兴趣的模型镜像

参考代码：截止2024.02未开源

动机与出发点
这篇文章是在StreamMapNet的基础上做的，为了在局部地图感知任务上提升时序上的感知稳定性，参考DN-DETR中的去噪方案，为局部地图感知提出一种针对局部地图元素的加噪声方案以及去噪逻辑。注意的是，这里DN去噪操作是在上一帧GT的基础上做的，原因是上一帧的感知结果存在相对GT存在更大不确定性（感知结果质量、地图元素新增和去除），为了训练的稳定性。文章由于noise机制的引入增加了一些超参数的引入，不过文章也通过消融实验给出了对应合适的取值。

方法设计
文章算法的结构见下图所示：
在这里插入图片描述
明显的差异是其在StreamMapNet的基础上增加了去噪分支，这个分支需要确定参与去噪的地图元素与当前帧的对应关系（也就是上图中的Adaptive Temporal Matching），以及寻找到对应关系之后依据元素之间的距离计算加噪声的力度（也就是上图中对应的Dynamic Query Noising）。之后就是在噪声元素基础上构建query进行解码和去噪了。

噪声的生成
1. 噪声源与对应GT的确定
为什么选择前一帧的GT作为去噪步骤的信息来源，在上面的内容中已经做了解释，按照文中的解释是为了训练的稳定性。那么怎么确定前一帧GT和当前帧GT呢？自然是使用CD（Chamfer distance）距离了，这个距离会按照距离值计算两帧GT每个元素之间的最匹配的索引和对应的距离值（自然在计算距离之前需要根据ego-motion将前一帧元素变换到当前帧下，也就是得到 $\hat{y}$ ）：
$D,idx=\min_{j\in[1,m]}(CD(y_i^t,\hat{y}_j^{t-1}))$
那么拿到两帧之间的匹配关系之后，就可以依据每个元素的的宽高（有外接矩形确定）和设定的超参数 $\alpha$ （容忍度系数调节）来确定匹配的阈值：
$\delta=\alpha\frac{w+h}{2}$
这种自适应的匹配阈值和固定阈值对性能带来的影响见下表：
在这里插入图片描述

2. 噪声添加
这里将地图元素描述为有序点的形式，用一个外接矩形去包围它，那么调整外接矩形中心的位置和宽高就可以调整这个地面元素上点的位置了，因为设定了地图元素上每个点相对矩形的相对位置是不变的。也就是下图中对地图元素做sift和scale操作
在这里插入图片描述
那么sift和scale操作的幅度是多大呢？一个思路是可以根据匹配的结果来确定，那么就可以在基准噪声（ $\eta=\{\Delta x,\Delta y,\Delta w,\Delta h\}$ ）的基础上添加一个增益因子 $R_{decay}$ ：
$R_{decay}=1-\frac{D}{\gamma\cdot\frac{\delta}{\alpha}}$
其中， $\gamma$ 为增益控制因子，那么在增益的加持下添加noise的过程描述为：
$B_{ins}=\{x,y,w,h\}+\{\Delta x,\Delta y,\Delta w,\Delta h\}\cdot R_{decay}$
那么这个超参数的取值和对性能的影响见下表：
在这里插入图片描述

noising query的生成
对于加了noise之后地图元素上的某个点 $p_i^m=\{x_i,y_i\}$ ，将它的位置进行编码 $PE(\cdot)是MLP$ ：
$P_i^m=MLP^{(pt)}(Concat(PE(x_i^m),PE(y_i^m)))$
那么这个元素的编码就是元素上所有点编码的组合：
$Pos_q=MLP^{(pos)}(Concat(P_1^m,\dots,P_n^m))$
这个关于位置的编码再加上关于类别的编码就是这个noise之后的地图元素的query了：
$Q_{denoise}=MLP^{(fuse)}(Concat(C_q,Pos_q))$