maskrcnn_benchmark 代码详解之 roi_box_feature_extractors.py

本文详细介绍了在Mask R-CNN的maskrcnn_benchmark库中,roi_box_feature_extractors.py文件的作用。该文件定义了三种RoI特征提取方法:ResNet卷积层、MIL全连接层和多卷积层组+全连接层组合,用于对RPN产生的预测边框进行尺度一致的特征提取,以进行目标检测任务。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

前言:

  在经过RPN层之后,网络会生成多个预测边框(proposal), 这时候需要对这些边框进行RoI池化,使之成为尺度一致的特征。接下来就需要对这些特征进行进一步的特征提取,这就需要用到roi_box_feature_extractors.py。roi_box_feature_extractors.py定义了三种不同的特种提取方式:ResNet卷基层方式、MIL全连接方式以及使用多个卷基层组+全连接方式。其代码详解为:

# Copyright (c) Facebook, Inc. and its affiliates. All Rights Reserved.
import torch
from torch import nn
from torch.nn import functional as F

from maskrcnn_benchmark.modeling import registry
from maskrcnn_benchmark.modeling.backbone import resnet
from maskrcnn_benchmark.modeling.poolers import Pooler
from maskrcnn_benchmark.modeling.make_layers import group_norm
from maskrcnn_benchmark.modeling.make_layers import make_fc


# 使用ResNet50的Conv5层来提取roi特征
@registry.ROI_BOX_FEATURE_EXTRACTORS.register("ResNet50Conv5ROIFeatureExtractor")
class ResNet50Conv5ROIFeatureExtractor(nn.Module):
    def __init__(self, config, in_channels):
        super(ResNet50Conv5ROIFeatureExtractor, self).__init__()
        # resolution为roi pooling之后特征图的大小,一般为7
        resolution = config.MODEL.ROI_BOX_HEAD.POOLER_RESOLUTION
        # 获得原始图到特征图的比例函数,比如原始图到Res50的stage2是1/4
        scales = config.MODEL.ROI_BOX_HEAD.POOLER_SCALES
        # sampling_ratio即采样率,指的是锚点大小与池化之后特征图的大小比例。一般情况下不指定
        sampling_ratio = config.MODEL.ROI_BOX_HEAD.POOLER_SAMPLING_RATIO
        # 初始化池化类,内含ROIAlign函数
        pooler =
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值