1.hog描述子在opencv中为HOGDescriptor。
2.可以调用该描述子setSVMDetector方法给用于对hog特征进行分类的svm模型的系数赋值,这里的参数为HOGDescriptor::getDefaultPeopleDetector()时表示采用系统默认的参数,因为这些参数是用很多图片训练而来的。
3.对输入图片进行行人检测时由于图片的大小不一样,所以要用到多尺度检测。这里是用hog类的方法detectMultiScale。参数解释如下:
HOGDescriptor::detectMultiScale(constGpuMat& img,vector<Rect>& found_locations,double hit_threshold=0,Size win_stride=Size(),Size padding=Size(),double scale0=1.05,int group_threshold=2)
该函数表示对输入的图片img进行多尺度行人检测 img为输入待检测的图片;found_locations为检测到目标区域列表;参数3为程序内部计算为行人目标的阈值,也就是检测到的特征到SVM分类超平面的距离;参数4为滑动窗口每次移动的距离。它必须是块移动的整数倍;参数5为图像扩充的大小;参数6为比例系数,即滑动窗口每次增加的比例;参数7为组阈值,即校正系数,当一个目标被多个窗口检测出来时,该参数此时就起了调节作用,为0时表示不起调节作用。
4.<span style="color:#000000"><span style="font-family:Ubuntu;"><span style="font-size:12px;"><span lang="zh-CN">最后对检测出来的目标矩形框,要采用一些方法处理,比如说</span></span></span><span style="font-family:Ubuntu;"><span style="font-size:12px;">2</span></span><span style="font-family:Ubuntu;"><span style="font-size:12px;"><span lang="zh-CN">个目标框嵌套着,则选择最外面的那个框。</span></span></span></span> 5.<span style="color:#000000"><span style="font-family:Ubuntu;"><span style="font-size:12px;"><span lang="zh-CN">因为</span></span></span><span style="font-family:Ubuntu;"><span style="font-size:12px;">hog</span></span><span style="font-family:Ubuntu;"><span style="font-size:12px;"><span lang="zh-CN">检测出的矩形框比实际人体框要稍微大些</span></span></span><span style="font-family:Ubuntu;"><span style="font-size:12px;">,</span></span><span style="font-family:Ubuntu;"><span style="font-size:12px;"><span lang="zh-CN">所以需要对这些矩形框大小尺寸做一些调整。</span></span></span></span>
- void Dialog::on_detectButton_clicked()
- {
- vector<Rect> found, found_filtered; //容器里装着Rect类型数据
- cv::HOGDescriptor people_dectect_hog;
- //采用默认的已经训练好了的svm系数作为此次检测的模型
- people_dectect_hog.setSVMDetector(cv::HOGDescriptor::getDefaultPeopleDetector());
- //对输入的图片img进行多尺度行人检测
- //img为输入待检测的图片;found为检测到目标区域列表;参数3为程序内部计算为行人目标的阈值,也就是检测到的特征到SVM分类超平面的距离;
- //参数4为滑动窗口每次移动的距离。它必须是块移动的整数倍;参数5为图像扩充的大小;参数6为比例系数,即滑动窗口每次增加的比例;
- //参数7为组阈值,即校正系数,当一个目标被多个窗口检测出来时,该参数此时就起了调节作用,为0时表示不起调节作用。
- people_dectect_hog.detectMultiScale(img, found, 0, Size(8, 8), Size(32, 32), 1.05, 2);
- //从源码中可以看出:
- //#define __SIZE_TYPE__ long unsigned int
- //typedef __SIZE_TYPE__ size_t;
- //因此,size_t是一个long unsigned int类型
- size_t i, j;
- for (i = 0; i < found.size(); i++ )
- {
- Rect r = found[i];
- <span style="color:#FF0000;">//下面的这个for语句是找出所有没有嵌套的矩形框r,并放入found_filtered中,如果有嵌套的
- //话,则取外面最大的那个矩形框放入found_filtered中</span>
- for(j = 0; j <found.size(); j++)
- if(j != i && (<span style="color:#FF0000;">r&found[j]</span>)==r) //这可求出两个矩形的交集,如果被嵌套在里面则赶紧停止
- break;
- if(j == found.size()) //如果没有被嵌套,则放入容器中
- found_filtered.push_back(r);
- }
- <span style="color:#FF0000;">//在图片img上画出矩形框,因为hog检测出的矩形框比实际人体框要稍微大些,所以这里需要
- //做一些调整</span>,X坐标增加点,Y坐标增加点,宽度和高度减少点,然后,给出
- for(i = 0; i <found_filtered.size(); i++)
- {
- Rect r = found_filtered[i];
- r.x += cvRound(r.width*0.1);
- r.width = cvRound(r.width*0.8);
- r.y += cvRound(r.height*0.07);
- r.height = cvRound(r.height*0.8);
- rectangle(img, r.tl(), r.br(), Scalar(0, 255, 0), 3);
- //画方框rectangle( image, pt1, pt2, randomColor(rng), MAX(thickness, -1), lineType );
- }
- imwrite("../hog_test_result.jpg", img);
- ui->textBrowser->clear();
- ui->textBrowser->append("<img src="http://archive.cnblogs.com/a/hog_test_result.jpg>");
- }