目标检测与跟踪技术解析
1. 目标检测
1.1 Focal Loss与RetinaNet
Focal Loss是一种用于解决目标检测中类别不平衡问题的损失函数,其公式为:
[FL(p_t) = -\alpha_t(1 - p_t)^{\gamma} \log(p_t)]
其中,
[p_t =
\begin{cases}
p, & \text{if } y = 1 \
1 - p, & \text{otherwise}
\end{cases}]
这里,$y$ 是真实标签,$p$ 是 $y = 1$ 的预测概率,$\alpha_t$ 是一个权重因子,当 $y = 1$ 时等于 $\alpha$,否则等于 $1 - \alpha$,$0 \leq \alpha \leq 1$,它负责平衡正负样本;$\gamma$ 是一个聚焦参数,$\gamma \geq 0$,负责对难易样本进行加权。
RetinaNet采用了常见的目标检测架构,包含一个现成的网络和两个分支,一个用于目标分类,另一个用于边界框回归。为了实现这一点,它使用了特征金字塔网络(FPN)。FPN在目标检测等任务中被广泛使用,因为它能有效地创建数据的多尺度表示,基于FPN的Faster R - CNN变体已被证明是有用的。通过增强标准卷积神经网络,FPN创建了一个自上而下的路径,并在各层之间建立横向连接,从而从单个输入图像中生成不同尺度的多个“层次”表示。在RetinaNet中,与其他检测器类似,定位是相对于一组锚框进行预测的,每个FPN层使用9个锚框。在这种架构和新颖的Focal Loss的作用下,RetinaNet在目标检测方
超级会员免费看
订阅专栏 解锁全文
5万+

被折叠的 条评论
为什么被折叠?



