【论文阅读笔记】Segmentation as Selective Search for Object Recognition

本文介绍了一种结合图片分割和选择性搜索的方法来确定物体位置。通过图像分割算法和层次算法,有效解决了传统穷举搜索方法存在的耗时问题。此外,利用多种颜色空间提升了方法的召回率,并最终应用于物体识别。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

        Koen E. A. van deSande  IJCV 2012

       本文主要介绍了结合图片分割和选择性搜索(Selective Search)的方法确定物体位置的方法。先前的做法主要使用穷举搜索(Exhaustive Search),即选择一个window扫描整张图像,然后再改变Window大小继续扫描,这种方法比较耗时,因此不能用于更复杂的特征提取和图片数量较多的场合。文中提出的算法通过图像分割(Image Segmentation)以及使用一种层次算法(Hierarchical Algorithm)巧妙地解决这个问题。

一.图像分割

        首先使用 EfficientGraph-BasedImage Segmentation 算法,将图片进行过分割。过分割后的每个region非常小,以此为基础,对相邻的region进行相似度判断并融合,形成不同尺度下的region。每个region对应一个bounding box。


        使用相似度的概念进行region合并:

        

       

         算法为(借鉴了http://blog.youkuaiyun.com/mao_kun/article/details/50576003):

         

                 输入:彩色图片(三通道)

                输出:物体位置的可能结果L

               1.使用 EfficientGraph-Based Image Segmentation【1】的方法获取原始分割区域R={r1,r2,…,rn}

               2.初始化相似度集合S

               3.计算两两相邻区域之间的相似度(见第三部分),将其添加到相似度集合S中

              4.从相似度集合S中找出,相似度最大的两个区域 ri 和rj,将其合并成为一个区域 rt,从相似度集合中除去原先与ri和rj相邻区域之间计算的相似度,计算rt与其相邻区域 (原先与ri或rj相邻的区域)的相似度,将其结果添加的到相似度集合S中。同时将新区域 rt 添加到区域集合R中。

             5.获取每个区域的Bounding Boxes,这个结果就是物体位置的可能结果L

二.使用多颜色空间提升Recall

        文章采用了8中不同的颜色方式,主要是为了考虑场景Shadow, Shading 和 Highlight Edges不同,使用的颜色空间有:(1)RGB,(2)灰度I,(3)Lab,(4)rgI(归一化的rg通道加上灰度),(5)HSV,(6)rgb(归一化的RGB),(7)C,(8)H(HSV的H通道)。就通过HierarchicalAlgorithm的图片将送入不同颜色空间处理,每种颜色空间对于不同阴影、光照、边有不同的敏感度,综合这些颜色空间使之对于各种场景的图片都能拥有较好的效果。

三.用于物体识别

      文章最后将该方法用于物体识别,使用SVM作为分类器。


       另外一篇博文关于selective Serach写得很详尽,这里给出链接,供有兴趣更深入了解的童鞋阅读http://blog.youkuaiyun.com/mao_kun/article/details/50576003。



评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值