Fast-RCNN

本文深入探讨Fast-RCNN的关键技术,包括ROI pooling、SVD数据压缩、multi-task loss整合分类与bbox回归,以及image-centric sampling提高计算效率。通过对比SPP-NET,阐述Fast-RCNN在目标检测领域的创新与优化。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

拖了很久采写

1.Fast-RCNN总结:

参考论文https://blog.youkuaiyun.com/shenxiaolu1984/article/details/51036677

https://www.jianshu.com/p/fbbb21e1e390

参考代码:https://github.com/Liu-Yicheng/Fast-RCNN

1.根据SPP-NET中空间金字塔的原理,采用ROI pooling 方法,空间金字塔是3个不同大小的卷积核池化后相加,ROI pooling是一个卷积核池化。

2.ROI pooling得到的特征图连接fc层时采用SVD,减少数据运算

3.不再采用SVM分类,使用Softmax的方式分类,把分类和bbox放在一起训练,提出了multi-task loss,整合两个损失函数。

4.image-centric sampling,同一图像的候选区域卷积共享计算和内存,降低了运算开销。

说白了就是规定进入网络的2个图像,每个图像取64个ROI,64个ROI可以复用这张图片前5个阶段的网络特征。

就是64个ROI的前5个的卷积核参数一样。(这里不太理解)

1.trian

2.test

代码太少,而且太过古老,使用caffe ,暂时不再去尝试。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值