目标检测 —— Selective Search 算法

最新推荐文章于 2025-03-25 08:55:14 发布

冉茂松

最新推荐文章于 2025-03-25 08:55:14 发布

阅读量1.1k

点赞数 1

分类专栏：目标检测

本文链接：https://blog.youkuaiyun.com/u014630987/article/details/99072284

版权

GitHub
简书
 优快云

论文题目: Selective Search for Object Recognition

1. 前言

由于目标检测和图像分类的不同，一张图可能存在多个目标，因此为了定位和识别出图片中的目标，一个简单的做法是通过 滑动窗口 的方法来将图像分割成许多的子区域，然后进行识别和坐标修正。但是这种方法有一个缺点就是：他是在图像上通过穷举的方法找出所有的子区域，这样就会导致生成的小区域数量居多。而 Selective Search 是另一种基于区域的方法，该方法能大大减少子区域的数量。并且在 R-CNN 和 Fast R-CNN 中均利用该算法来生成 Region Proposals。

2. Selective Search

该算法有三个优势：

捕捉不同尺度(Capture All Scales)
多样化(Diversification)
计算速度快(Fast to Compute)

该方法主要包括两个内容：

Hierarchical Grouping Algorithm
Diversification Strategies

选择性算法使用的是按层次合并算法（Hierarchical Grouping），基本思路如下：首先使用论文“Efficient Graph-Based Image Segmentation”中的方法生成一些起始的小区域，之后使用贪心算法将区域归并到一起：先计算所有临近区域间的相似度（通过颜色，纹理，吻合度，大小等相似度），将最相似的两个区域归并，然后重新计算临近区域间的相似度，归并相似区域直至整幅图像成为一个区域

2.1 Hierarchical Grouping Algorithm(层次合并算法)

在这里插入图片描述

使用 Efficient Graph-Based Image Segmentation的方法获取原始分割区域R={r1,r2,…,rn}；
初始化相似度集合S=∅；
计算两两相邻区域之间的相似度，将其添加到相似度集合S中；

从相似度集合S中找出相似度最大的两个区域 ri 和rj，
将其合并成为一个区域 rt，
从相似度集合S中除去原先与ri和rj相邻区域之间计算的相似度，
计算rt与其相邻区域（原先与ri或rj相邻的区域）的相似度，将其结果添加到相似度集合S中，
同时将新区域rt添加到区域集合R中；

在集合R中所有区域获取每个区域的Bounding Boxes，这个结果就是物体位置的可能结果L。

2.2 Diversification Strategies（多样性策略）

作者在这里主要考虑了三种不同的多样性策略：

颜色空间多样性
相似度多样性
初始化区域多样性

2.2.1 颜色空间多样性

考虑场景以及光照条件等，作者采用了8种不同的颜色空间，这个策略主要应用于图像分割算法中原始区域的生成。主要使用的颜色空间有：（1）RGB，（2）灰度I，（3）Lab，（4）rgI（归一化的rg通道加上灰度），（5）HSV，（6）rgb（归一化的RGB），（7）C（8）H（HSV的H通道）。具体如下：

在这里插入图片描述

2.2.2 相似度多样性

1. 颜色度量

$C_i=\{c_i^1, \cdots c_i^n\}$ 表示第 i 个区域的在三个通道上的研制直方图，每个颜色通道有 25 个 bins 的直方图，这样三个通道共有 n=75 个 bins, 即 $C_i$ 为一个 75 维的向量，切该直方图使用 L1-norm标准化了，且用如下公式计算颜色相似度：