选择性搜索（Selective Search）：目标检测的“候选区域生成”艺术

原创

于 2025-09-09 08:15:00 发布 · 821 阅读

·

28

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#目标检测 #人工智能 #计算机视觉 #选择性搜索 #SS

前言：为什么需要选择性搜索？

在计算机视觉领域，目标检测（Object Detection）是一个核心任务，它不仅要识别图像中有什么物体（分类问题），还要找出这些物体的具体位置（定位问题）。

在深度学习时代之前，滑动窗口法（Sliding Window）是一种常用的目标检测方法。想象一下，为了找到图像中的目标，我们需要用一个“框”在图像上以不同的尺寸和长宽比从左到右、从上到下地滑动，并对每个框内的图像块进行分类判断。这种方法简单粗暴，但计算量极大，效率低下，因为它会产生成千上万个可能包含目标的子区域（Patches），需要对每一个都进行计算。

为了解决这个问题，研究人员提出了候选区域（Region Proposal）算法。这类算法旨在快速生成可能包含物体的、数量较少的候选区域，从而避免无谓的计算。选择性搜索（Selective Search） 就是其中一种流行且高效的方法，它被广泛应用于诸如 R-CNN、Fast R-CNN 等早期深度学习目标检测模型中。

一、选择性搜索的核心思想 🎯

选择性搜索的核心思想非常直观：图像中的物体通常不是由孤立的像素组成的，而是由一些颜色、纹理、大小等特征相似的连续区域构成。因此，与其盲目地滑动窗口，不如采用自底向上的方式，先将图像分割成许多小区域，然后根据相似度逐步合并这些区域，形成更大的、可能包含完整物体的区域。这些合并后的区域就是我们的候选区域。

选择性搜索通过合并相似区域来生成候选框，例如从细小区域逐步合并成可能包含物体的较大区域。

与滑动窗口法相比，选择性搜索的优势在于：

计算量更小：生成的候选区域数量通常只有几千个，远少于滑动窗口产生的数十万甚至数百万个子区域。
多尺度检测：通过合并过程，自然产生了各种尺度的候选框，适应不同大小的物体。
适应性更强：

最低0.47元/天解锁文章

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

AI妈妈手把手 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。