R-FCN

整个R-FCN的结构

  • 一个base的conv网络如ResNet101
  • 一个RPN(Faster RCNN来的)
  • 一个position sensitive的prediction层
  • 一个position sensitive的bbox reg层
  • 最后的ROI pooling+投票的决策层

共有C个类别

Base的输出进入两条支路

一条进入取Faster R-CNN一样的RPN得到RoI
一条进入FCN网络

创新-FCN:

使得模型保持对于位置的敏感性

clslayercls−layer:对于base产生的WH1024W∗H∗1024的输出,进行使用kernel size = 1,filters = (C+1)K2(C+1)∗K2的卷积操作,来得到一个[W][H][(C+1)K2][W]∗[H]∗[(C+1)∗K2]的结果
reglayerreg−layer:则是用111∗1conv获得KK4K∗K∗4channel的输出

从中抽取ROI对应相关的区域,尺度即为whw∗h,进行Position Sensitive的卷积
KK指示将RoI分割为KK个小bin,每一个尺寸为wKhKwK∗hK
这里写图片描述
RoI的每一个小bin都对应(C+1)(C+1)个score map,在每张score map上只取与这个bin相关的[wK][hK][wK]∗[hK]部分,最后在这(C+1)(C+1)wKhKwK∗hK的区域上进行pooling,此处的相关性保留了位置信息,得到(C+1)(C+1)的向量
左上角的bin代表该ROI包含object左上部分属于不同类别的概率
不同位置进行拼接,整体最后得到[K][K][(C+1)][K]∗[K]∗[(C+1)]的输出
reg部分也进行psroi pooling,平均池化。

投票

k*k个bin直接进行求和或投票(每个类单独做)得到每一类的score,并进行softmax得到每类的最终得分,并用于计算损失

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值