Faster Read: Selective Search for Object Recognition

本文介绍了一种基于SelectiveSearch的物体识别方法,该方法利用Efficient Graph-Based Image Segmentation进行图像分割,并结合SVM进行物体分类。通过层级结构考虑物体布局关系,提高识别准确性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Selective Search

keywords: object recognition, machine learning, SVM

论文名称:Selective Search for Object Recognition

MLA
Uijlings, Jasper RR, et al. "Selective search for object recognition." International journal of computer vision 104.2 (2013): 154-171.

Prerequisite: SVM(用于训练), Efficient Graph-Based Image Segmentation(用于分割原始图像)
目的: 用了segmentation和grouping的方法来进行object proposal,然后用了一个SVM进行物体识别。
北京: 在做物体识别(Object Recognition)过程中,不能通过单一的策略来区分不同的物体,需要充分考虑图像物体的多样性(diversity)。另外,在图像中物体的布局有一定的层次(hierarchical)关系,考虑这种关系才能够更好地对物体的类别(category)进行区分。

方法:

选取阶段:

  1. 使用 Efficient Graph-Based Image Segmentation 的方法获取原始分割区域R={r1,r2,…,rn} 
  2. 初始化相似度集合S=∅
  3. 计算两两相邻区域之间的相似度,将其添加到相似度集合S中
  4. 从相似度集合S中找出,相似度最大的两个区域 ri 和rj,将其合并成为一个区域 rt,从相似度集合中除去原先与ri和rj相邻区域之间计算的相似度,计算rt与其相邻区域(原先与ri或rj相邻的区域)的相似度,将其结果添加的到相似度集合S中。同时将新区域 rt 添加到 区域集合R中。
  5. 获取R中每个区域的Bounding Boxes,这个结果就是物体位置的可能结果L

识别阶段:


训练方法采用SVM。首先选择包含真实结果(ground truth)的物体窗口作为正样本(positive examples),选择与正样本窗口重叠20%~50%的窗口作为负样本(negative examples)。在选择样本的过程中剔除彼此重叠70%的负样本,这样可以提供一个较好的初始化结果。在重复迭代过程中加入hard negative examples(得分很高的负样本),由于训练模型初始化结果较好,模型只需要迭代两次就可以了。

论文原创:相似度计算(包括颜色colour,材质texture,大小size和拟合度fit)

细节看ref:


帮助阅读论文:

Rich feature hierarchies for accurate object detection and semantic segmentation (RCNN)

帮助部分:帮助选择图片中的region proposal




评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值