前言:为什么需要RCNN?
各位小伙伴们大家好! 在之前的文章中,我们介绍了OverFeat模型👇点击回顾OverFeat模型原理,它是早期将深度学习应用于目标检测的开拓者之一。不过OverFeat存在一些明显局限性:它采用滑动窗口方式在图像上不同位置和尺度进行检测,这种方法类似一种暴力穷举方式,计算量大且效率不高,由于窗口大小问题,而且难以精确处理不同长宽比的物体。
今天我们要介绍的RCNN(Regions with CNN features)模型,则开创性地提出了"候选区域+CNN特征提取"的两阶段思路,极大地推动了目标检测领域的发展!
一、RCNN核心思想:另辟蹊径的解决方案
RCNN由Ross Girshick等人在2014年提出,其核心思想非常直观:既然直接在图像上滑动窗口计算量大,何不先找出可能包含物体的区域,再对这些区域进行分类? 🤔
这就好比我们要在图书馆找一本书,OverFeat的方法是逐个书架逐本书检查,而RCNN则是先根据书籍的类别、大小等信息先确定几个可能的位置,再仔细检查这些位置。
RCNN的三大创新点
- 使用候选区域(Region Proposals):先找出图像中可能包含物体的区域,极大减少计算量
- 使用CNN提取特征:将每个候选区域输入CNN,提取高质量特征表示
RCNN:目标检测的革新之路

最低0.47元/天 解锁文章
585

被折叠的 条评论
为什么被折叠?



