R-CNN之前的准备:Selective Search for Object Recognition

SelectiveSearch算法是一种用于目标检测的任务,能高效地从图像中提取出潜在的目标候选区域。相较于传统的滑窗方法,它能减少计算资源消耗的同时提高检测质量。算法基于图像分割,通过层次聚类实现多尺度的目标检测,并利用多样性的颜色空间和相似性度量策略来增强检测效果。
部署运行你感兴趣的模型镜像

    在阅读这篇博客之前,推荐先阅读关于讲解Efficient Graph-Based Image Segmentation 的这篇关于图像分割的博客,因为这个图像分割算法是selective search算法的一个重要的组成部分。
    先说这个算法是用来干嘛的吧。这个算法的作用是给定一张图片,输出一系列的可能包含物体的矩形框,这些矩形框我们称之为检测建议(detection proposals),一般而言,这些检测建议随后会被送入分类器进行类别的判定。然后讲讲如果不用这种提出检测建议的方法的话,我们以前是怎么做的吧。以前的经典方法是滑窗法,顾名思义,用一个尺度固定的窗口在图像上滑动,对一张图片可以得到大量的检测建议,然后使用分类器对这些检测建议进行类别的分类。由于图片中存在的物体的尺度是各种各样的,你可以想象电视是方的,人是细窄的,篮球是圆的,而且它们在图片中的大小还各不一样,因此还需要多个尺度以及宽高比的窗口在图像上滑动。可想而知,对于一张图片使用多个尺度和宽高比的窗口在上面进行滑动从而产生检测建议的数量是巨大的,而且这个过程也无疑是非常耗费计算资源的一件事情。由于产生了大量的检测建议,也意味着后面的分类器也需要进行更多的分类动作,也同样加重了计算机的负担。最后,这种方法的意义我们就可以知道了,那就是在耗费合理的计算资源的情况下,提出更少的检测建议,但同时还要尽可能把图片中的物体都包含住。用论文中的一句话来表达就是“Our goal is to generate a class-independent,data-driven, selective search strategy that generates a small set of high-quality object locations.”
    selective search算法主要基于以下三个方面的考虑:
    [1]能够捕捉所有的尺度。上文中提到,在滑窗法中为

您可能感兴趣的与本文相关的镜像

Qwen-Image-Edit-2509

Qwen-Image-Edit-2509

图片编辑
Qwen

Qwen-Image-Edit-2509 是阿里巴巴通义千问团队于2025年9月发布的最新图像编辑AI模型,主要支持多图编辑,包括“人物+人物”、“人物+商品”等组合玩法

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值