计算机视觉中的目标检测与识别技术
非极大值抑制
在目标检测中,当使用滑动窗口扫描图像时,会得到许多重叠的区域。非极大值抑制(Non-maximum suppression)技术可以帮助我们处理这些重叠区域,只保留得分最高的区域,抑制其他得分较低的重叠区域。
非极大值抑制的基本原理是,对于图像中同一区域的多个检测结果,只保留得分最高的那个,丢弃其他得分较低的结果。这是因为相邻的窗口往往会有较高的得分,而我们只对最佳结果的窗口感兴趣。
具体操作步骤如下:
1. 构建图像金字塔后,使用滑动窗口方法扫描图像进行目标检测。
2. 收集所有返回正结果(超过某个任意阈值)的当前窗口,并选择响应最高的窗口 W。
3. 消除所有与 W 显著重叠的窗口。
4. 移动到下一个响应最高的窗口,并对当前尺度重复上述过程。
当当前尺度的处理完成后,移动到图像金字塔的下一个尺度,重复上述过程。为了确保在整个非极大值抑制过程结束时窗口能正确表示,需要根据图像的原始大小计算窗口大小。
以下是一个简单的流程图展示非极大值抑制的过程:
graph TD;
A[构建图像金字塔] --> B[滑动窗口扫描图像];
B --> C[收集正结果窗口];
C --> D[选择最高响应窗口 W];
D --> E[消除与 W 重叠窗口];
E --> F[移动到下一个窗口];
F --> G{当前尺度处理完?};
G -- 否 --> D;
G -- 是 --&g
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



