自定义目标检测与目标跟踪技术解析
1. 结合SVM与滑动窗口进行目标检测
将SVM分类器与滑动窗口技术和图像金字塔相结合,能实现以下改进:
- 检测图像中多个同类目标。
- 确定图像中每个检测到的目标的位置和大小。
具体实现步骤如下:
1. 滑动窗口移动 :选取图像的一个区域进行分类,然后将窗口按预定义的步长向右移动。当到达图像最右端时,将x坐标重置为0,向下移动一步,重复整个过程。
2. SVM分类 :在每一步,使用基于词袋(BoW)训练的SVM进行分类。
3. 记录正检测窗口 :记录SVM判定为正检测的所有窗口。
4. 图像金字塔处理 :对整个图像的每个窗口分类完成后,缩小图像并重复使用滑动窗口的过程,即使用图像金字塔,持续缩放和分类直到达到最小尺寸。
完成上述过程后,虽然收集到了图像内容的重要信息,但可能会存在大量重叠的正检测窗口,即同一目标可能被多次检测。为解决此问题,需使用非极大值抑制(NMS)过滤结果。
2. 场景中的汽车检测
为了实现汽车检测,我们创建一个新的Python脚本 detect_car_bow_svm_sliding_window.py ,通过复制之前的 detect_car_bow_svm.py 脚本。新脚本大部分实现保持不变,仍需训练BoW描述符提取器和SVM,但训练完成后,将以新方式处理测试图像,具体步骤如下:
1.
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



