15、自定义目标检测器构建指南

自定义目标检测器构建指南

1. HOG 特征描述

HOG(Histogram of Oriented Gradients)将图像划分为多个单元格,通过可视化可以清晰看到车辆的轮子和主要结构。在第一种可视化方式中,每个单元格计算得到的梯度用一组交叉线表示,有时看起来像拉长的星星,星星的长轴代表更强的梯度;在第二种可视化方式中,梯度表现为单元格内不同轴上亮度的平滑过渡。

1.1 HOG 描述图像区域

对于每个 HOG 单元格,其直方图的区间数量等于 HOG 考虑的梯度数量或轴方向数量。计算完所有单元格的直方图后,HOG 会处理这些直方图组以生成更高级别的描述符。具体来说,单元格会被组合成更大的区域,称为块。块可以由任意数量的单元格组成,但在行人检测中,2x2 单元格的块效果最佳。会创建一个块级向量并进行归一化,以补偿光照和阴影的局部变化(单个单元格区域太小,难以检测到这些变化),这种归一化提高了基于 HOG 的检测器在不同光照条件下的鲁棒性。

1.2 处理目标位置和尺度变化

与其他检测器一样,基于 HOG 的检测器需要处理目标位置和尺度的变化。通过在图像上移动固定大小的滑动窗口来解决在不同位置搜索的问题;通过将图像缩放到不同大小形成图像金字塔来解决在不同尺度搜索的问题。但会遇到重叠窗口中多次检测的难题,比如使用滑动窗口进行行人检测时,窗口小步长滑动会多次框住同一个人。我们希望只报告一个认为正确的位置,这就需要非极大值抑制(NMS)。给定一组重叠区域,NMS 会抑制(或拒绝)分类器未产生最大分数的所有区域。

2. 理解非极大值抑制(NMS)

NMS 的概念看似简单,即从一组重叠的解决方案中选择最

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值