retinanet之anchor

本文深入解析RetinaNet中的锚框(anchor)概念,包括其生成过程、参数设置及在不同金字塔层级上的应用。介绍了scales和ratios如何决定锚框的大小和宽高比,以及这些参数在目标检测任务中的作用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

retinanet之anchor

1.综述

anchor即目标检测的先验框,retinanet的anchor有scales和ratios,根据每个pyramid_levels生成三个scales,三个ratios,然后形成九种先验框。
scales:anchor的大小(宽)
ratios:anchor的宽高比

2.参数:pyramid_levels, strides, sizes, ratios, scales

class Anchors(nn.Module):
    def __init__(self, pyramid_levels=None, strides=None, sizes=None, ratios=None, scales=None):
        super(Anchors, self).__init__()

        if pyramid_levels is None:
            self.pyramid_levels = [3, 4, 5, 6, 7]
        if strides is None:
            self.strides = [2 ** x for x in self.pyramid_levels]
        if sizes is None:
            self.sizes = [2 ** (x + 2) for x in self.pyramid_levels]
        if ratios is None:
            self.ratios = np.array([0.5, 1, 2])
        if scales is None:
            self.scales = np.array([2 ** 0, 2 ** (1.0 / 3.0), 2 ** (2.0 / 3.0)])

pyramid_level:feature map标号,对应resnet的p3层到p7层
strides:滑窗的步长
size:窗口的宽
ratios:宽高比
scales:面积比例

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值