OpenCV running

最新推荐文章于 2022-03-27 23:15:51 发布

mengfanteng

最新推荐文章于 2022-03-27 23:15:51 发布

阅读量601

点赞数

CC 4.0 BY-SA版权

分类专栏： Opencv

本文链接：https://blog.youkuaiyun.com/mtt_sky/article/details/43084635

Opencv 专栏收录该内容

26 篇文章

订阅专栏

本文详细介绍了使用HOG描述子进行行人检测的过程。包括设置SVM分类器、多尺度检测参数解析及目标框处理方法等内容。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

实验说明：

　　1.hog描述子在opencv中为HOGDescriptor。　

2.可以调用该描述子setSVMDetector方法给用于对hog特征进行分类的svm模型的系数赋值，这里的参数为HOGDescriptor::getDefaultPeopleDetector()时表示采用系统默认的参数，因为这些参数是用很多图片训练而来的。　　

　　3.对输入图片进行行人检测时由于图片的大小不一样，所以要用到多尺度检测。这里是用hog类的方法detectMultiScale。参数解释如下：

HOGDescriptor::detectMultiScale(constGpuMat& img,vector<Rect>& found_locations,double hit_threshold=0,Size win_stride=Size(),Size padding=Size(),double scale0=1.05,int group_threshold=2)

　　该函数表示对输入的图片img进行多尺度行人检测 img为输入待检测的图片；found_locations为检测到目标区域列表；参数3为程序内部计算为行人目标的阈值，也就是检测到的特征到SVM分类超平面的距离;参数4为滑动窗口每次移动的距离。它必须是块移动的整数倍；参数5为图像扩充的大小；参数6为比例系数，即滑动窗口每次增加的比例；参数7为组阈值，即校正系数，当一个目标被多个窗口检测出来时，该参数此时就起了调节作用，为0时表示不起调节作用。

      4.<span style="color:#000000"><span style="font-family:Ubuntu;"><span style="font-size:12px;"><span lang="zh-CN">最后对检测出来的目标矩形框，要采用一些方法处理，比如说</span></span></span><span style="font-family:Ubuntu;"><span style="font-size:12px;">2</span></span><span style="font-family:Ubuntu;"><span style="font-size:12px;"><span lang="zh-CN">个目标框嵌套着，则选择最外面的那个框。</span></span></span></span>
      5.<span style="color:#000000"><span style="font-family:Ubuntu;"><span style="font-size:12px;"><span lang="zh-CN">因为</span></span></span><span style="font-family:Ubuntu;"><span style="font-size:12px;">hog</span></span><span style="font-family:Ubuntu;"><span style="font-size:12px;"><span lang="zh-CN">检测出的矩形框比实际人体框要稍微大些</span></span></span><span style="font-family:Ubuntu;"><span style="font-size:12px;">,</span></span><span style="font-family:Ubuntu;"><span style="font-size:12px;"><span lang="zh-CN">所以需要对这些矩形框大小尺寸做一些调整。</span></span></span></span>

[cpp] view plain copy

void Dialog::on_detectButton_clicked()
{
vector<Rect> found, found_filtered; //容器里装着Rect类型数据
cv::HOGDescriptor people_dectect_hog;
//采用默认的已经训练好了的svm系数作为此次检测的模型
people_dectect_hog.setSVMDetector(cv::HOGDescriptor::getDefaultPeopleDetector());
//对输入的图片img进行多尺度行人检测
//img为输入待检测的图片；found为检测到目标区域列表；参数3为程序内部计算为行人目标的阈值，也就是检测到的特征到SVM分类超平面的距离;
//参数4为滑动窗口每次移动的距离。它必须是块移动的整数倍；参数5为图像扩充的大小；参数6为比例系数，即滑动窗口每次增加的比例；
//参数7为组阈值，即校正系数，当一个目标被多个窗口检测出来时，该参数此时就起了调节作用，为0时表示不起调节作用。
people_dectect_hog.detectMultiScale(img, found, 0, Size(8, 8), Size(32, 32), 1.05, 2);
//从源码中可以看出:
//#define __SIZE_TYPE__ long unsigned int
//typedef __SIZE_TYPE__ size_t;
//因此,size_t是一个long unsigned int类型
size_t i, j;
for (i = 0; i < found.size(); i++ )
{
Rect r = found[i];
//下面的这个for语句是找出所有没有嵌套的矩形框r,并放入found_filtered中,如果有嵌套的
//话,则取外面最大的那个矩形框放入found_filtered中
for(j = 0; j <found.size(); j++)
if(j != i && (r&found[j])==r) //这可求出两个矩形的交集，如果被嵌套在里面则赶紧停止
break;
if(j == found.size()) //如果没有被嵌套，则放入容器中
found_filtered.push_back(r);
}
//在图片img上画出矩形框,因为hog检测出的矩形框比实际人体框要稍微大些,所以这里需要
//做一些调整，X坐标增加点，Y坐标增加点，宽度和高度减少点，然后，给出
for(i = 0; i <found_filtered.size(); i++)
{
Rect r = found_filtered[i];
r.x += cvRound(r.width*0.1);
r.width = cvRound(r.width*0.8);
r.y += cvRound(r.height*0.07);
r.height = cvRound(r.height*0.8);
rectangle(img, r.tl(), r.br(), Scalar(0, 255, 0), 3);
//画方框rectangle( image, pt1, pt2, randomColor(rng), MAX(thickness, -1), lineType );
}
imwrite("../hog_test_result.jpg", img);
ui->textBrowser->clear();
ui->textBrowser->append("<img src="http://archive.cnblogs.com/a/hog_test_result.jpg>");
}