论文源码:https://github.com/princeton-vl/CornerNet-Lite
`
论文中,用于匹配角点的损失函数如下(embedding的损失):

在embedding损失函数的算法实现中,除了需要输入预测出的嵌入图,还需要给出真实值角点位置的索引,以及用于滤除无关计算的二进制掩膜。该掩膜在每个通道上使用一维的向量表示,其前N个值为1,其余为0,N为该通道下图像中存在的真实目标数。
角码将输出嵌入图在每个通道下转化为一维数据,再根据真实值位置的索引,调换元素位置,使得一维嵌入图上那些原本位于真实角点位置上的元素被移动到前面,且在两条一维嵌入向量同一位置的元素属于同一目标。这个重排列过程如下图所示:
·
如上图所示,将得到的两个一维嵌入值向量合并再除以2,取二进制掩膜下的主值区间,就得到了同一通道下每个目标两个嵌入值得均值,通过遍历掩膜主值区间的元素,进而对所有同属一个目标的一对角点使用"pull"Loss计算损失。
当对不同目标的嵌入计算"push"Loss时,受到表格法排列组合的启发,一维的嵌入向量在不同方向上被扩展升至二维方阵,再经相减得到嵌入组合矩阵,便可得到那些真实角点嵌入值所有排列组合的差值结果。沿袭上图示意,嵌入组合操作如下图所示:

这篇博客深入解析了CornerNet-Lite论文中用于角点检测的损失函数,包括embedding损失、heatmap损失的实现。文章详细介绍了如何通过重排列嵌入图并计算平均值来实现'pull' Loss,以及利用嵌入组合矩阵计算'push' Loss。此外,还展示了二进制掩膜在损失计算中的作用,以及如何通过掩膜排除不同目标间的无关计算。整个过程旨在优化模型对角点匹配的精确度。
最低0.47元/天 解锁文章
1180

被折叠的 条评论
为什么被折叠?



