OpenCV running

本文详细介绍了使用HOG描述子进行行人检测的过程。包括设置SVM分类器、多尺度检测参数解析及目标框处理方法等内容。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

实验说明:

  1.hog描述子在opencv中为HOGDescriptor。 

         2.可以调用该描述子setSVMDetector方法给用于对hog特征进行分类的svm模型的系数赋值,这里的参数为HOGDescriptor::getDefaultPeopleDetector()时表示采用系统默认的参数,因为这些参数是用很多图片训练而来的。  

  3.对输入图片进行行人检测时由于图片的大小不一样,所以要用到多尺度检测。这里是用hog类的方法detectMultiScale。参数解释如下:

 HOGDescriptor::detectMultiScale(constGpuMat& img,vector<Rect>& found_locations,double hit_threshold=0,Size win_stride=Size(),Size padding=Size(),double scale0=1.05,int group_threshold=2)

  该函数表示对输入的图片img进行多尺度行人检测 img为输入待检测的图片;found_locations为检测到目标区域列表;参数3为程序内部计算为行人目标的阈值,也就是检测到的特征到SVM分类超平面的距离;参数4为滑动窗口每次移动的距离。它必须是块移动的整数倍;参数5为图像扩充的大小;参数6为比例系数,即滑动窗口每次增加的比例;参数7为组阈值,即校正系数,当一个目标被多个窗口检测出来时,该参数此时就起了调节作用,0时表示不起调节作用。

      4.<span style="color:#000000"><span style="font-family:Ubuntu;"><span style="font-size:12px;"><span lang="zh-CN">最后对检测出来的目标矩形框,要采用一些方法处理,比如说</span></span></span><span style="font-family:Ubuntu;"><span style="font-size:12px;">2</span></span><span style="font-family:Ubuntu;"><span style="font-size:12px;"><span lang="zh-CN">个目标框嵌套着,则选择最外面的那个框。</span></span></span></span>
      5.<span style="color:#000000"><span style="font-family:Ubuntu;"><span style="font-size:12px;"><span lang="zh-CN">因为</span></span></span><span style="font-family:Ubuntu;"><span style="font-size:12px;">hog</span></span><span style="font-family:Ubuntu;"><span style="font-size:12px;"><span lang="zh-CN">检测出的矩形框比实际人体框要稍微大些</span></span></span><span style="font-family:Ubuntu;"><span style="font-size:12px;">,</span></span><span style="font-family:Ubuntu;"><span style="font-size:12px;"><span lang="zh-CN">所以需要对这些矩形框大小尺寸做一些调整。</span></span></span></span>
  1. void Dialog::on_detectButton_clicked()  
  2. {  
  3. vector<Rect> found, found_filtered; //容器里装着Rect类型数据  
  4. cv::HOGDescriptor people_dectect_hog;  
  5. //采用默认的已经训练好了的svm系数作为此次检测的模型  
  6.     people_dectect_hog.setSVMDetector(cv::HOGDescriptor::getDefaultPeopleDetector());  
  7. //对输入的图片img进行多尺度行人检测  
  8. //img为输入待检测的图片;found为检测到目标区域列表;参数3为程序内部计算为行人目标的阈值,也就是检测到的特征到SVM分类超平面的距离;  
  9. //参数4为滑动窗口每次移动的距离。它必须是块移动的整数倍;参数5为图像扩充的大小;参数6为比例系数,即滑动窗口每次增加的比例;  
  10. //参数7为组阈值,即校正系数,当一个目标被多个窗口检测出来时,该参数此时就起了调节作用,为0时表示不起调节作用。  
  11. people_dectect_hog.detectMultiScale(img, found, 0, Size(8, 8), Size(32, 32), 1.05, 2);  
  12. //从源码中可以看出:  
  13. //#define __SIZE_TYPE__ long unsigned int  
  14. //typedef __SIZE_TYPE__ size_t;  
  15. //因此,size_t是一个long unsigned int类型  
  16.     size_t i, j;  
  17. for (i = 0; i < found.size(); i++ )  
  18. {  
  19.    Rect r = found[i];  
  20. <span style="color:#FF0000;">//下面的这个for语句是找出所有没有嵌套的矩形框r,并放入found_filtered中,如果有嵌套的  
  21. //话,则取外面最大的那个矩形框放入found_filtered中</span>  
  22.    for(j = 0; j <found.size(); j++)  
  23.    if(j != i && (<span style="color:#FF0000;">r&found[j]</span>)==r)        //这可求出两个矩形的交集,如果被嵌套在里面则赶紧停止  
  24.      break;  
  25.    if(j == found.size())                //如果没有被嵌套,则放入容器中  
  26.      found_filtered.push_back(r);  
  27. }  
  28. <span style="color:#FF0000;">//在图片img上画出矩形框,因为hog检测出的矩形框比实际人体框要稍微大些,所以这里需要  
  29. //做一些调整</span>,X坐标增加点,Y坐标增加点,宽度和高度减少点,然后,给出  
  30. for(i = 0; i <found_filtered.size(); i++)  
  31. {  
  32.   Rect r = found_filtered[i];  
  33.   r.x += cvRound(r.width*0.1);  
  34.   r.width = cvRound(r.width*0.8);  
  35.   r.y += cvRound(r.height*0.07);  
  36.   r.height = cvRound(r.height*0.8);  
  37.   rectangle(img, r.tl(), r.br(), Scalar(0, 255, 0), 3);    
  38. //画方框rectangle( image, pt1, pt2, randomColor(rng), MAX(thickness, -1), lineType );  
  39. }  
  40.   imwrite("../hog_test_result.jpg", img);  
  41.   ui->textBrowser->clear();  
  42.   ui->textBrowser->append("<img src="http://archive.cnblogs.com/a/hog_test_result.jpg>");  

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值