目标检测（区域提议方法）：Selective Search 从算法原理到源码

最新推荐文章于 2025-05-31 13:54:02 发布

牛顿爱吃香蕉

最新推荐文章于 2025-05-31 13:54:02 发布

阅读量3.9k

点赞数

CC 4.0 BY-SA版权

分类专栏： Python 目标检测论文计算机视觉经典论文笔记文章标签： selective search 目标检测区域提议

本文链接：https://blog.youkuaiyun.com/weixin_41665360/article/details/97957039

目标检测（区域提议方法）：Selective Search 从原理到源码

1、主要思想

深度学习目标检测算法有两大主要分支，一支是以 $R - C N N$ 为代表的 $t w o - s t a g e$ 类算法，一支是以 $Y O L O$ 和 $S S D$ 为代表的 $o n e - s t a g e$ 类算法。两类算法各有优劣，通常 $o n e - s t a g e$ 类算法速度占优， $t w o - s t a g e$ 类算法精度占优。两者的主要区别在于是否使用 区域提议方法 提供待检测目标的大致分布区域。

$R - C N N$ 系列算法主要使用了两种区域提议方法，一种是 $S e l e c t i v e S e a r c h$ 算法（简称 $S S$ 算法），一种是基于 $C N N$ 的 $R P N$ 网络。基于研究的目的，本文主要讨论 $S e l e c t i v e S e a r c h$ 算法。考虑到 纸上得来终觉浅 ，本文将结合 $R C N N$ 中 $S S$ 算法源码，以便加深对算法的理解。

2、原理

$Q ： S S$ 算法怎么想到的？

目标检测大致包含两个小任务：目标定位和目标分类。直接从图像中找到目标并准确分类通常很困难。因此考虑是否能够先给出目标位置，然后在图像中的每个目标的位置进行局部分类。这样就能够将两个问题分解开来逐个击破。

$Q ：$ 如何获取目标位置？

首先我们可能会想到用其他更简单的检测算法来获取所有目标的大致位置，但是这种方法会使最终检测算法受限于区域提议使用的检测算法的精度和召回率。

在不使用其他检测算法定位的基础上，考虑与位置相关的视觉算法，很自然地联想到图像分割。我们可以首先将图像分割成一块块可能包含目标的区域，然后对相应的区域进行分类和修整。 $S S$ 算法选择了 $F e l z e n s w a l b$ 分割算法进行分割。

$S e l e c t i v e S e a r c h$ 算法主要有三个优势：

捕捉不同尺度

多样化

计算快

基于颜色、纹理、大小和形状计算区域相似度，并形成分层分组。该算法主要包含两个部分： $H i e r a r c h i c a l G r o u p i n g A l g o r i t h m$ 、 $D i v e r s i f i c a t i o n S t r a t e g i e s$ 。以下将结合源码分别对两部分进行解读。