注意力引导的6D物体姿态估计与口腔X光辅助机器人设计
在计算机视觉领域,6D物体姿态估计是一个重要的研究方向,同时在医疗领域,口腔X光辅助机器人的设计也具有重要的实际意义。下面将分别介绍注意力引导的6D物体姿态估计方法和基于人脸识别的口腔X光辅助机器人的设计。
注意力引导的6D物体姿态估计
多约束损失函数
损失函数的设计受到相关研究的启发,网络输出保留分割和单位向量场两个输出。原损失函数为:
$L = L_{seg} + L_{vf}$
其中,$L_{seg} = - \sum_{c=1}^{C} y_{c} \log(p_{c})$ ,$L_{vf} = \sum_{k_{i} \in K} \sum_{p \in O} l_{1}(e_{i}|x) + l_{1}(e_{i}|y)$ 。这里,$L_{seg}$ 是语义分割损失,$L_{vf}$ 是向量场损失,$K$ 代表关键点,$O$ 是目标物体区域,$e_{i}$ 是单位夹角向量,$p_{c}$ 是物体类别的预测概率,$y_{c}$ 是物体类别的真实概率。
然而,单位向量的预测忽略了每个像素与2D关键点之间的实际距离。对于远离2D关键点的像素点,方向上的小偏差会在交点投票过程中导致较大误差。因此,在损失函数中添加了两个根据距离信息加权的正则项,以规范单位向量场的预测。多约束损失函数定义为:
$L^{*} = L_{seg} + L_{vf} + \alpha L_{dis} + \beta L_{gra}$
其中,$L_{dis} = \sum_{k_{i} \in K} \sum_{p \in O} l_{1}(\mu \times (|u_{i}|^{2}
超级会员免费看
订阅专栏 解锁全文
1165

被折叠的 条评论
为什么被折叠?



