多轮空间置信感知协作式3D目标检测系统的研究与实践
1. 系统核心组件
- 特征融合模块 :该模块采用多头注意力机制,并结合空间置信图和感知距离这两个额外先验信息,使特征融合更具针对性。与其他基于逐位置注意力的融合模块相比,它能助力注意力学习,优先选择高质量和关键的特征。
- 检测解码器 :其作用是将特征解码为目标,涵盖类别和回归输出。给定第 $k$ 轮通信时的特征图 $F_i^{(k)}$,检测解码器 $\phi_{dec}(\cdot)$ 会生成第 $i$ 个智能体的检测结果 $\hat{O} i^{(k)} = \phi {dec}(F_i^{(k)}) \in \mathbb{R}^{H\times W\times 7}$。这里,$\hat{O}_i^{(k)}$ 的每个位置代表一个旋转框,包含类别 $(c, x, y, h, w, \cos\alpha, \sin\alpha)$,分别表示类别置信度、位置、大小和角度。这些目标即为所提出的协作感知系统的最终输出,其中 $\hat{O}_i^{(0)}$ 表示无协作时的检测结果。
2. 训练细节与损失函数
- 训练任务 :为训练整个系统,需监督两个任务,即每一轮的空间置信度生成和目标检测。空间置信度生成器的功能与检测解码器中的分类功能相同,为提升参数效率,空间置信度生成器复用了检测解码器的参数。
- 损失函数 :对于多轮设置,每一轮都有一个检测损失,整体损失为 $L = \s
超级会员免费看
订阅专栏 解锁全文
44

被折叠的 条评论
为什么被折叠?



