R-FCN论文解读

R-FCN是基于Faster R-CNN的改进网络,通过使用ResNet作为基础结构并引入position sensitive prediction层,提高了运行速度和效率,同时保持了检测准确性。关键改进包括将所有ResNet层置于共享子网络中,减少计算量,以及利用K^2(C+1)的卷积层进行位置敏感的评分映射,结合ROIpooling和投票决策层,恢复目标位置信息。损失函数包含分类和回归两部分。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

相比较之前的faster-rcnn而言,rfcn比之运行速度更快,效率更高,在准确率上也没有下降。那么rfcn网络到底是什么样的网络呢?其比faster-rcnn的区别在哪里呢?

一、rfcn的基本结构:

1.一个基本的conv网络:ResNet101--------------->提取基本的特征

2.一个RPN网络(Faster Rcnn来的)

3.一个position sensitive的prediction层

4.ROIpooling+投票的决策层


---RFCN的idea出发点:

分类需要特征具有平移不变性,检测则要求对目标的平移作出准确的响应。Faster-rcnn类的方法在ROIpooling前都是卷积的,是具备平移不变性的,但一旦插入ROIpooling之后,后面的网络结构就不再具备平移不变性了。因此,我们需要position sensitive core map来把目标的位置信息融入到ROIpooling中

---希望:

将耗时的卷积层都尽量移到前面共享的subnetwork上,也就是产生共享的feature map的网络

---具体的改进:

Faster-rcnn中用的Resnet(前91层共享,插入ROIpooling,后面10层不共享)。

RFCN把所有的101层都改在了前面共享的subnetwork上,最后的prediction层卷积只用了一层,大大减少了计算量。

---实现:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值