目标检测 —— Selective Search 算法

GitHub
简书
优快云

论文题目: Selective Search for Object Recognition

1. 前言

由于目标检测和图像分类的不同,一张图可能存在多个目标,因此为了定位和识别出图片中的目标,一个简单的做法是通过 滑动窗口 的方法来将图像分割成许多的子区域,然后进行识别和坐标修正。但是这种方法有一个缺点就是: 他是在图像上通过穷举的方法找出所有的子区域,这样就会导致生成的小区域数量居多。而 Selective Search 是另一种基于区域的方法,该方法能大大减少子区域的数量。并且在 R-CNN 和 Fast R-CNN 中均利用该算法来生成 Region Proposals。

2. Selective Search

该算法有三个优势:

  1. 捕捉不同尺度(Capture All Scales)
  2. 多样化(Diversification)
  3. 计算速度快(Fast to Compute)

该方法主要包括两个内容:

  1. Hierarchical Grouping Algorithm
  2. Diversification Strategies

选择性算法使用的是按层次合并算法(Hierarchical Grouping),基本思路如下:首先使用论文“Efficient Graph-Based Image Segmentation”中的方法生成一些起始的小区域,之后使用贪心算法将区域归并到一起:先计算所有临近区域间的相似度(通过颜色,纹理,吻合度,大小等相似度),将最相似的两个区域归并,然后重新计算临近区域间的相似度,归并相似区域直至整幅图像成为一个区域

2.1 Hierarchical Grouping Algorithm(层次合并算法)

在这里插入图片描述

使用 Efficient Graph-Based Image Segmentation的方法获取原始分割区域R={r1,r2,…,rn};
初始化相似度集合S=∅;
计算两两相邻区域之间的相似度,将其添加到相似度集合S中;

从相似度集合S中找出相似度最大的两个区域 ri 和rj,
将其合并成为一个区域 rt,
从相似度集合S中除去原先与ri和rj相邻区域之间计算的相似度,
计算rt与其相邻区域(原先与ri或rj相邻的区域)的相似度,将其结果添加到相似度集合S中,
同时将新区域rt添加到区域集合R中;

在集合R中所有区域获取每个区域的Bounding Boxes,这个结果就是物体位置的可能结果L。

2.2 Diversification Strategies(多样性策略)

作者在这里主要考虑了三种不同的多样性策略:

  1. 颜色空间多样性
  2. 相似度多样性
  3. 初始化区域多样性

2.2.1 颜色空间多样性

考虑场景以及光照条件等,作者采用了8种不同的颜色空间,这个策略主要应用于图像分割算法中原始区域的生成。主要使用的颜色空间有:(1)RGB,(2)灰度I,(3)Lab,(4)rgI(归一化的rg通道加上灰度),(5)HSV,(6)rgb(归一化的RGB),(7)C(8)H(HSV的H通道)。具体如下:

在这里插入图片描述

2.2.2 相似度多样性

1. 颜色度量

C i = { c i 1 , ⋯ c i n } C_i=\{c_i^1, \cdots c_i^n\} Ci={ ci1,cin} 表示第 i 个区域的在三个通道上的研制直方图,每个颜色通道有 25 个 bins 的直方图,这样三个通道共有 n=75 个 bins, 即 C i C_i Ci 为一个 75 维的向量,切该直方图使用 L1-norm标准化了,且用如下公式计算颜色相似度:

(1) s c o l o r ( r i , r j ) = ∑ k = 1 n min ⁡ ( r i k , r j k ) s_{color}(r_i, r_j)=\sum_{k=1}^n \min(r_i^k, r_j^k) \tag{1} scolor(ri,rj)=k=1nmin(rik,rjk

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值