计算机视觉中的目标检测技术详解
1. 图像金字塔与滑动窗口
在计算机视觉的目标检测领域,图像金字塔是一个重要概念。级联分类器会尝试在输入图像的不同尺度上检测目标。 detectMultiScale() 方法中的 scaleFactor 参数代表了在图像金字塔的每一步中,图像被重新采样为较小尺寸的比例。 scaleFactor 参数越小,金字塔的层数就越多,操作会更慢且计算量更大,但在一定程度上结果会更准确。
滑动窗口是计算机视觉中用于多尺度目标检测的技术。它通过检查图像的移动部分(滑动窗口),并结合图像金字塔进行检测。这样可以在不同尺度上检测目标,解决目标定位问题。不过,这种方法会产生重叠区域的问题。例如在人脸检测中,一个滑动窗口可能在四个不同位置都与同一张脸匹配,但我们只希望报告一个匹配结果,且只关注得分最高的部分。
2. 非极大值抑制
非极大值抑制(Non-maximum suppression)用于抑制与图像同一区域相关但不是该区域最大得分的所有结果。当使用滑动窗口检查图像时,我们希望保留围绕同一目标重叠的一组窗口中最好的窗口。具体操作是,将所有重叠超过阈值 x 的窗口进行非极大值抑制操作。
非极大值抑制的一般步骤如下:
1. 构建图像金字塔后,使用滑动窗口方法扫描图像进行目标检测。
2. 收集所有返回正结果(超过某个任意阈值)的当前窗口,并选取响应最高的窗口 W 。
3. 消除所有与 W 显著重叠的窗口。
4.
超级会员免费看
订阅专栏 解锁全文
2390

被折叠的 条评论
为什么被折叠?



