maskrcnn-benchmark 代码详解之　resnet.py_maskrcnn-benchmark源码解析-优快云博客

本文链接：https://blog.youkuaiyun.com/leijieZhang/article/details/90730922

本文详细解析了maskrcnn-benchmark库中Resnet网络的结构，包括Resnet的基础结构、区块(block)结构，特别是Bottleneck和Stem区块的详细构建过程。此外，还介绍了Resnet总体结构的实现，包括不同类型的Resnet backbones及其封装。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

１Resnet 结构

　　Resnet 一般分为５个卷积(conv)层，每一层为一个stage。其中每一个stage中由不同数量的相同的block(区块)构成，这些区块的个数就是block_count, 第一个stage跟其他几个stage结构完全不同，也可以看做是由单独的区块构成的，因此由区块不停堆叠构成的第二层到第５层(即stage2-stage5或conv2-conv5)，分别定义为index1-index4.就像搭积木一样，这四个层可有基本的区块搭成。下图为resnet的基本结构：

resnet structure — Resnet 的结构以及在代码中一些变量的描述

　　以下代码通过控制区块的多少，搭建出不同的Resnet(包括Resnet50等）：

# -----------------------------------------------------------------------------
# Standard ResNet models
# -----------------------------------------------------------------------------
# ResNet-50 (包括所有的阶段)
# ResNet 分为５个阶段，但是第一个阶段都相同，变化是从第二个阶段开始的，所以下面的index是从第二个阶段开始编号的。其中block_count为该阶段区块的个数
ResNet50StagesTo5 = tuple(
    StageSpec(index=i, block_count=c, return_features=r)
    for (i, c, r) in ((1, 3, False), (2, 4, False), (3, 6, False), (4, 3, True))
)
# ResNet-50 up to stage 4 (excludes stage 5)
ResNet50StagesTo4 = tuple(
    StageSpec(index=i, block_count=c, return_features=r)
    for (i, c, r) in ((1, 3, False), (2, 4, False), (3, 6, True))
)
# ResNet-101 (including all stages)
ResNet101StagesTo5 = tuple(
    StageSpec(index=i, block_count=c, return_features=r)
    for (i, c, r) in ((1, 3, False), (2, 4, False), (3, 23, False), (4, 3, True))
)
# ResNet-101 up to stage 4 (excludes stage 5)
ResNet101StagesTo4 = tuple(
    StageSpec(index=i, block_count=c, return_features=r)
    for (i, c, r) in ((1, 3, False), (2, 4, False), (3, 23, True))
)
# ResNet-50-FPN (including all stages)
ResNet50FPNStagesTo5 = tuple(
    StageSpec(index=i, block_count=c, return_features=r)
    for (i, c, r) in ((1, 3, True), (2, 4, True), (3, 6, True), (4, 3, True))
)
# ResNet-101-FPN (including all stages)
ResNet101FPNStagesTo5 = tuple(
    StageSpec(index=i, block_count=c, return_features=r)
    for (i, c, r) in ((1, 3, True), (2, 4, True), (3, 23, True), (4, 3, True))
)
# ResNet-152-FPN (including all stages)
ResNet152FPNStagesTo5 = tuple(
    StageSpec(index=i, block_count=c, return_features=r)
    for (i, c, r) in ((1, 3, True), (2, 8, True), (3, 36, True), (4, 3, True))
)

　根据以上的不同组合方案，maskrcnn benchmark可以搭建起不同的backbone:

def _make_stage(
    transformation_module,
    in_channels,
    bottleneck_channels,
    out_channels,
    block_count,
    num_groups,
    stride_in_1x1,
    first_stride,
    dilation=1,
    dcn_config={}
):
    blocks = []
    stride = first_stride
    # 根据不同的配置，构造不同的卷基层
    for _ in range(block_count):
        blocks.append(
            transformation_module(
                in_channels,
                bottleneck_channels,
                out_channels,
                num_groups,
                stride_in_1x1,
                stride,
                dilation=dilation,
                dcn_config=dcn_config
            )
        )
        stride = 1
        in_channels = out_channels
    return nn.Sequential(*blocks)

这几种不同的backbone之后被集成为一个统一的对象以便于调用，其代码为: