【论文阅读笔记】Segmentation as Selective Search for Object Recognition

最新推荐文章于 2024-04-26 21:45:01 发布

原创最新推荐文章于 2024-04-26 21:45:01 发布 · 987 阅读

5 ·

CC 4.0 BY-SA版权

机器学习专栏收录该内容

96 篇文章

订阅专栏

本文介绍了一种结合图片分割和选择性搜索的方法来确定物体位置。通过图像分割算法和层次算法，有效解决了传统穷举搜索方法存在的耗时问题。此外，利用多种颜色空间提升了方法的召回率，并最终应用于物体识别。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Koen E. A. van deSande IJCV 2012

本文主要介绍了结合图片分割和选择性搜索（Selective Search）的方法确定物体位置的方法。先前的做法主要使用穷举搜索（Exhaustive Search），即选择一个window扫描整张图像，然后再改变Window大小继续扫描，这种方法比较耗时，因此不能用于更复杂的特征提取和图片数量较多的场合。文中提出的算法通过图像分割（Image Segmentation）以及使用一种层次算法（Hierarchical Algorithm）巧妙地解决这个问题。

一.图像分割

首先使用 EfficientGraph-BasedImage Segmentation 算法，将图片进行过分割。过分割后的每个region非常小，以此为基础，对相邻的region进行相似度判断并融合，形成不同尺度下的region。每个region对应一个bounding box。

使用相似度的概念进行region合并：

算法为(借鉴了http://blog.youkuaiyun.com/mao_kun/article/details/50576003)：

输入：彩色图片（三通道）

输出：物体位置的可能结果L

1.使用 EfficientGraph-Based Image Segmentation【1】的方法获取原始分割区域R={r1,r2,…,rn}

2.初始化相似度集合S

3.计算两两相邻区域之间的相似度（见第三部分），将其添加到相似度集合S中

4.从相似度集合S中找出，相似度最大的两个区域 ri 和rj，将其合并成为一个区域 rt，从相似度集合中除去原先与ri和rj相邻区域之间计算的相似度，计算rt与其相邻区域（原先与ri或rj相邻的区域）的相似度，将其结果添加的到相似度集合S中。同时将新区域 rt 添加到区域集合R中。

5.获取每个区域的Bounding Boxes，这个结果就是物体位置的可能结果L

二.使用多颜色空间提升Recall

文章采用了8中不同的颜色方式，主要是为了考虑场景Shadow, Shading 和 Highlight Edges不同，使用的颜色空间有：（1）RGB，（2）灰度I，（3）Lab，（4）rgI（归一化的rg通道加上灰度），（5）HSV，（6）rgb（归一化的RGB），（7）C，（8）H（HSV的H通道）。就通过HierarchicalAlgorithm的图片将送入不同颜色空间处理，每种颜色空间对于不同阴影、光照、边有不同的敏感度，综合这些颜色空间使之对于各种场景的图片都能拥有较好的效果。

三.用于物体识别

文章最后将该方法用于物体识别，使用SVM作为分类器。