OpenCVSharp:HOG行人检测

概述

HOG行人检测是一种基于方向梯度直方图特征的计算机视觉目标检测技术,它通过计算图像局部区域的梯度方向直方图来描述目标的外观形状特征。该算法首先将图像分割为小的连通区域(细胞单元),计算每个单元内像素的梯度方向并生成直方图,然后将相邻的细胞单元组合成块并对块内的直方图进行归一化处理,最终形成能够有效描述行人轮廓和形状的特征向量。这些特征向量被输入到预先训练好的SVM分类器中,判断图像区域是否包含行人,并通过多尺度扫描策略在不同大小的窗口中搜索目标,从而实现对图像中行人的准确检测和定位。

实践

/* by 01022.hk - online tools website : 01022.hk/zh/websocket.html */
// 读取图像
using var img = Cv2.ImRead(ImagePath, ImreadModes.Color);
if (img.Empty())
{
    MessageBox.Show("无法读取图像文件", "错误", MessageBoxButton.OK, MessageBoxImage.Error);
    return;
}

// 创建HOG描述符
using var hog = new HOGDescriptor();
hog.SetSVMDetector(HOGDescriptor.GetDefaultPeopleDetector());

// 检查检测器大小
bool b = hog.CheckDetectorSize();
Console.WriteLine("CheckDetectorSize: {0}", b);

// 运行人检测
// 使用默认参数运行检测器。要获得更高的命中率(以及更多的误报),
// 降低hitThreshold和groupThreshold(将groupThreshold设置为0以完全关闭分组)。
OpenCvSharp.Rect[] found = hog.DetectMultiScale(
    img, 
    HitThreshold, 
    new Size(8, 8), 
    new Size(24, 16), 
    1.05, 
    GroupThreshold);

按照读取图像、创建HOG描述符、检测三个步骤来实现。

可以发现里面自带了一个行人检测器。

查看SetSVMDetector方法:

/* by 01022.hk - online tools website : 01022.hk/zh/websocket.html */
public virtual void SetSVMDetector(float[] svmDetector)
{
    ThrowIfDisposed();

    using var svmDetectorVec = new VectorOfFloat(svmDetector);
    NativeMethods.HandleException(
        NativeMethods.objdetect_HOGDescriptor_setSVMDetector(ptr, svmDetectorVec.CvPtr));
    GC.KeepAlive(this);
}

SetSVMDetector 是 HOGDescriptor 类中的一个关键方法,用于设置线性 SVM 分类器的系数,这些系数决定了 HOG 描述符如何识别特定对象。

然后也是使用DetectMultiScale这个方法进行目标检测,查看它的函数签名:

public virtual Rect[] DetectMultiScale(Mat img, 
    double hitThreshold = 0, Size? winStride = null, Size? padding = null, double scale=1.05, int groupThreshold = 2)

DetectMultiScale 是 HOGDescriptor 类中最核心的方法之一,用于在图像中执行多尺度目标检测,特别适用于检测不同大小的目标对象。

参数名类型默认值含义说明调优建议
imgMat必需输入图像,支持 CV_8UC1(灰度图)和 CV_8UC4(彩色图)格式确保图像格式正确,必要时进行转换
hitThresholddouble0特征与 SVM 分类平面之间的距离阈值。值越低检测越敏感,值越高检测越严格误报多时增加此值,漏检时降低此值
winStrideSize?null窗口滑动步长,必须是块步长的倍数。控制检测窗口在图像上移动的步长较大值(如8x8)提高速度,较小值(如4x4)提高精度
paddingSize?null填充参数,为了保持 CPU 接口兼容性。必须为 (0,0)通常保持默认值即可
scaledouble1.05检测窗口的缩放系数,控制多尺度检测时窗口大小的变化率检测小目标时用接近1的值(1.01-1.03),速度优先时用较大值(1.1-1.2)
groupThresholdint2相似度阈值系数,用于合并重叠的检测框。值为0表示不执行分组同一对象被多矩形检测到时增加此值,不同对象被错误合并时降低此值

效果:

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值