(学习笔记) approxPolyDP函数 boundingRect函数

本文介绍如何使用OpenCV中的boundingRect和approxPolyDP函数进行轮廓的边界框计算及多边形拟合。详细解释了函数的调用方式、参数含义,并提供了具体的代码示例。

1、boundingRect函数

函数作用:

计算轮廓的垂直边界最小矩形,矩形是与图像上下边界平行的


2、boundingRect函数调用形式

C++: Rect boundingRect(InputArray points)

points

二维点集,点的序列或向量 (Mat


3、approxPolyDP函数

函数的作用:

对图像轮廓点进行多边形拟合

4、函数的调用形式

C++: void approxPolyDP(InputArray curve, OutputArray approxCurve, double epsilon, bool closed)

参数详解;

InputArray curve:一般是由图像的轮廓点组成的点集

OutputArray approxCurve:表示输出的多边形点集

 double epsilon:主要表示输出的精度,就是另个轮廓点之间最大距离数,5,6,7,,8,,,,,

bool closed:表示输出的多边形是否封闭


#include "cv.h"    
#include "highgui.h"    
#include <stdio.h>   


#include <opencv2/opencv.hpp>
#include<opencv2/imgproc/imgproc.hpp>


using namespace std;
using namespace cv;


Mat src;
Mat  src_gray;
int thresh = 100;
int max_thresh = 255;
RNG rng(12345);


void thresh_callback(int, void*);


int main(int argc, char** argv)
{
src = imread("1.jpg", 1);


cvtColor(src, src_gray, CV_BGR2GRAY);
blur(src_gray, src_gray, Size(3, 3));


char* source_window = "Source";
namedWindow(source_window, CV_WINDOW_AUTOSIZE);
imshow(source_window, src);


createTrackbar("Threshold:", "Source", &thresh, max_thresh, thresh_callback);
thresh_callback(0, 0);


waitKey(0);
return 0;


}


void thresh_callback(int, void*)
{


Mat threshold_output;
vector<vector<Point>> contours;
vector<Vec4i> hierarchy;
//Canny(src_gray, canny_Mat, thresh, thresh * 2, 3);
/// 使用Threshold检测边缘  
threshold(src_gray, threshold_output, thresh, 255, THRESH_BINARY);
findContours(threshold_output, contours, hierarchy,CV_RETR_TREE,CV_CHAIN_APPROX_SIMPLE, Point(0, 0));


/// 多边形逼近轮廓 + 获取矩形和圆形边界框  
vector<vector<Point>>contours_poly(contours.size());
vector<Rect> bondRect(contours.size());
vector<Point2f>center(contours.size());
vector<float>radius(contours.size());




for (int i = 0; i < contours.size(); i++)
{
approxPolyDP(Mat(contours[i]), contours_poly[i], 3, true);
bondRect[i] = boundingRect(Mat(contours[i]));
minEnclosingCircle(contours[i], center[i], radius[i]);
}


/// 画多边形轮廓 + 包围的矩形框 + 圆形框  
Mat drawing = Mat::zeros(threshold_output.size(), CV_8UC3);
for (int i = 0; i < contours.size(); i++)
{
Scalar color = Scalar(rng.uniform(0, 255), rng.uniform(0, 255), rng.uniform(0, 255));
drawContours(src, contours, i, color, 1, 8, hierarchy, 0, Point());
drawContours(drawing, contours_poly, i, color, 1, 8, vector<Vec4i>(), 0, Point());
rectangle(drawing,bondRect[i].tl(),bondRect[i].br(),color,2,8,0);
// circle(drawing, center[i], (int)radius[i], color, 2, 8, 0);


}
namedWindow("contours", CV_WINDOW_AUTOSIZE);
imshow("contours", drawing);
namedWindow("contours_src", CV_WINDOW_AUTOSIZE);
imshow("contours_src", src);


}


approxPolyDP函数是opencv中利用来对指定的点集进行逼近,其逼近的精度是可设置的对应的函数为:

void approxPolyDP(InputArray curve, OutputArray approxCurve, double epsilon, bool closed);

例如:approxPolyDP(contourMat, approxCurve, 10, true);//找出轮廓的多边形拟合曲线

第一个参数 InputArray curve:输入的点集
第二个参数OutputArray approxCurve:输出的点集,当前点集是能最小包容指定点集的。画出来即是一个多边形;
第三个参数double epsilon:指定的精度,也即是原始曲线与近似曲线之间的最大距离。
第四个参数bool closed:若为true,则说明近似曲线是闭合的,反之,若为false,则断开。

该函数采用是道格拉斯-普克算法(Douglas-Peucker)算法来实现。该算法也以Douglas-Peucker算法和迭代终点拟合算法为名。算法的目的是给出由线段组成的曲线(在某些上下文中也称为折线),以找到具有较少点的相似曲线。 该算法基于原始曲线和简化曲线(即曲线之间的豪斯多夫距离)之间的最大距离定义“不相似”。 简化曲线由定义原始曲线的点的子集组成。

算法描述如下:

起始曲线是有序的一组点或线,距离维度ε> 0。该算法递归地划分线。 最初给出了第一点和最后一点之间的所有点。 它会自动标记要保存的第一个和最后一个点。 然后找到距离第一点和最后一点组成的线段的最远的点作为终点; 这一点在距离终点之间的近似线段的曲线上显然最远。 如果该点比线段更接近于ε,那么当前未被标记的任何点将被保存,而没有简化的曲线比ε更差的可以丢弃。

如果离线段最远的点距离近似值大于ε,则必须保留该点。 该算法以第一个点和最远点递归地调用自身,然后以最远点和最后一个点(包括最远点被标记为保留)递归调用自身。
当递归完成时,可以生成一个新的输出曲线,其中包括所有且仅标记为保留的点。

非参数Ramer-Douglas-Peucker 
ε的选择通常是用户定义的。 像大多数线拟合/多边形近似/主点检测方法一样,通过使用由于数字化/量化的误差界限作为终止条件,可以使其非参数化[1] 这种非参数RDP算法[2]的MATLAB代码在这里可用[3]

伪代码:

假设输入是基于一一数组

function DouglasPeucker(PointList[], epsilon)
    // Find the point with the maximum distance
    dmax = 0
    index = 0
    end = length(PointList)
    for i = 2 to ( end - 1) {
        d = perpendicularDistance(PointList[i], Line(PointList[1], PointList[end])) 
        if ( d > dmax ) {
            index = i
            dmax = d
        }
    }
    // If max distance is greater than epsilon, recursively simplify
    if ( dmax > epsilon ) {
        // Recursive call
        recResults1[] = DouglasPeucker(PointList[1...index], epsilon)
        recResults2[] = DouglasPeucker(PointList[index...end], epsilon)

        // Build the result list
        ResultList[] = {recResults1[1...length(recResults1)-1], recResults2[1...length(recResults2)]}
    } else {
        ResultList[] = {PointList[1], PointList[end]}
    }
    // Return the result
    return ResultList[]
end
该算法用于处理矢量图形 和制图综合。该算法广泛应用于机器人技术[4]中,对旋转量程扫描仪采集的范围数据进行简化和去噪; 在这个领域中,它被称为分裂合并算法,归因于Duda和Hart。

该算法的复杂度可以利用线性递归来描述T(n) = 2T(n2) + O(n),其具有T(n)∈Θ(n log n)的公知解决方案(通过主定理)。

 然而,最坏情况的复杂度是Θ(n2)。

源码:

   1
   2
   3
   4
   5
   6
   7
   8
   9
  10
  11
  12
  13
  14
  15
  16
  17
  18
  19
  20
  21
  22
  23
  24
  25
  26
  27
  28
  29
  30
  31
  32
  33
  34
  35
  36
  37
  38
  39
  40
  41
  42
  43
  44
  45
  46
  47
  48
  49
  50
  51
  52
  53
  54
  55
  56
  57
  58
  59
  60
  61
  62
  63
  64
  65
  66
  67
  68
  69
  70
  71
  72
  73
  74
  75
  76
  77
  78
  79
  80
  81
  82
  83
  84
  85
  86
  87
  88
  89
  90
  91
  92
  93
  94
  95
  96
  97
  98
  99
 100
 101
 102
 103
 104
 105
 106
 107
 108
 109
             
#include "opencv2/imgproc.hpp"
#include "opencv2/highgui.hpp"
#include <math.h>
#include <iostream>
using namespace cv;
using namespace std;
static void help()
{
cout<< "\nThis program illustrates the use of findContours and drawContours\n"
<< "The original image is put up along with the image of drawn contours\n"
<< "Usage:\n"<< "./contours2\n"
<< "\nA trackbar is put up which controls the contour level from -3 to 3\n"
<< endl;
}
const int w = 500;
int levels = 3;
vector<vector<Point> > contours;
vector<Vec4i> hierarchy;
static void on_trackbar(int,void*)
{
Mat cnt_img = Mat::zeros(w, w, CV_8UC3);
int _levels = levels - 3;
drawContours( cnt_img, contours, _levels <=0 ? 3 : -1, Scalar(128,255,255),
3, LINE_AA, hierarchy, std::abs(_levels) );
imshow("contours", cnt_img);
}
int main( int argc, char** argv)
{
cv::CommandLineParser parser(argc, argv,"{help h||}");
if (parser.has("help"))
{
help();
return 0;
}
Mat img = Mat::zeros(w, w, CV_8UC1);
//Draw 6 faces
for( int i = 0; i < 6; i++ )
{
int dx = (i%2)*250 -30;
int dy = (i/2)*150;
const Scalar white = Scalar(255);
const Scalar black = Scalar(0);
if( i == 0 )
{
for( int j = 0; j <= 10; j++ )
{
double angle = (j+5)*CV_PI/21;
line(img, Point(cvRound(dx+100+j*10-80*cos(angle)),
cvRound(dy+100-90*sin(angle))),
Point(cvRound(dx+100+j*10-30*cos(angle)),
cvRound(dy+100-30*sin(angle))), white,1, 8, 0);
}
}
ellipse( img, Point(dx+150, dy+100),Size(100,70),0, 0, 360, white, -1,8, 0 );
ellipse( img, Point(dx+115, dy+70),Size(30,20),0, 0, 360, black, -1,8, 0 );
ellipse( img, Point(dx+185, dy+70),Size(30,20),0, 0, 360, black, -1,8, 0 );
ellipse( img, Point(dx+115, dy+70),Size(15,15),0, 0, 360, white, -1,8, 0 );
ellipse( img, Point(dx+185, dy+70),Size(15,15),0, 0, 360, white, -1,8, 0 );
ellipse( img, Point(dx+115, dy+70),Size(5,5),0, 0, 360, black, -1,8, 0 );
ellipse( img, Point(dx+185, dy+70),Size(5,5),0, 0, 360, black, -1,8, 0 );
ellipse( img, Point(dx+150, dy+100),Size(10,5),0, 0, 360, black, -1,8, 0 );
ellipse( img, Point(dx+150, dy+150),Size(40,10),0, 0, 360, black, -1,8, 0 );
ellipse( img, Point(dx+27, dy+100),Size(20,35),0, 0, 360, white, -1,8, 0 );
ellipse( img, Point(dx+273, dy+100),Size(20,35),0, 0, 360, white, -1,8, 0 );
}
//show the faces
namedWindow( "image",1 );
imshow( "image", img );
//Extract the contours so that
vector<vector<Point> > contours0;
findContours( img, contours0, hierarchy, RETR_TREE, CHAIN_APPROX_SIMPLE);
contours.resize(contours0.size());
for( size_t k = 0; k < contours0.size(); k++ )
approxPolyDP(Mat(contours0[k]), contours[k],3, true);
namedWindow( "contours",1 );
createTrackbar( "levels+3","contours", &levels,7, on_trackbar );
on_trackbar(0,0);
waitKey();
return 0;
}

<think>我们正在讨论的是在YOLO检测后处理中,如何将检测到的目标根据中心距离分组,并为每个组生成一个外接矩形。在这个过程中,可能会用到`cv2.boundingRect`函数。但是,请注意,我们之前的分组算法中,计算每个组的外接矩形时,实际上并没有直接使用`cv2.boundingRect`,而是通过计算组内所有矩形的最小和最大坐标来得到新的外接矩形。然而,如果组内的目标形成的形状不是轴对齐的矩形,或者我们希望得到更紧密的包围盒(比如旋转矩形),那么可能需要使用轮廓检测和`cv2.boundingRect`(用于轴对齐矩形)或`cv2.minAreaRect`(用于旋转矩形)。 根据引用[4]中提到的,`cv2.boundingRect`用于获取轮廓的外接矩形(轴对齐),而`cv2.minAreaRect`用于获取最小外接旋转矩形。 ### 问题分析 用户提到,他们使用YOLO检测得到了6个目标的中心位置和外接矩形,现在需要根据连接半径分组,并为每组生成一个外接矩形。用户特别询问了`boundingRect`函数在这个场景下的使用方法。 ### 关键点 1. **当前方法**:我们之前的方法是直接取组内所有目标外接矩形的坐标最小值和最大值来形成新的外接矩形。这种方法简单快速,适用于各个目标矩形都是轴对齐的情况,且组内目标的位置关系不会导致外接矩形过大(因为是取并集)。但是,这种方法可能会得到一个比实际需要大的矩形(因为每个目标原本的矩形可能已经包含了一些背景区域,再取并集可能会更大),并且如果组内目标形成的形状是倾斜的,那么轴对齐矩形可能不是最紧凑的。 2. **使用轮廓的方法**:如果我们希望得到更紧凑的外接矩形(特别是当组内目标形成的区域不是轴对齐时),我们可以考虑先将组内所有目标对应的掩码(mask)合并,然后通过轮廓检测得到整个组的轮廓,再使用`cv2.boundingRect`(轴对齐)或`cv2.minAreaRect`(旋转矩形)来得到外接矩形。但是,这里有一个前提:我们需要有每个目标的掩码(mask)信息,而不仅仅是外接矩形。 ### 两种方案的比较 - **方案1(坐标极值法)**:直接使用每个目标的外接矩形坐标,计算组的最小外接矩形(轴对齐)。这种方法不需要掩码,计算简单。 - **方案2(轮廓法)**:需要组内所有目标的掩码,然后将掩码合并成一个大的掩码(组内所有目标区域的并集),再对这个合并掩码进行轮廓检测,最后用`cv2.boundingRect`或`cv2.minAreaRect`得到外接矩形。这种方法更精确,但需要掩码信息(YOLO检测通常输出矩形框,但也可以输出掩码,如YOLOv8的实例分割)。 ### 在什么场景下使用`boundingRect`? 如果用户有每个目标的掩码(例如,使用YOLO的实例分割模式,如引用[1]中的代码),那么可以在分组后,将组内所有目标的掩码合并,然后使用`cv2.boundingRect`来得到整个组的轴对齐外接矩形。具体步骤: 1. 将组内每个目标的掩码(多边形或二值掩码)合并,形成一个大的掩码(取并集)。 2. 使用`cv2.findContours`找到合并掩码的轮廓(取最大的轮廓)。 3. 使用`cv2.boundingRect(contour)`得到轮廓的最小外接矩形(轴对齐)。 ### 示例代码(方案2,需要掩码) 假设我们已经得到了每个目标的掩码(例如,从YOLO实例分割模型中获取的`result.masks.xy`,即多边形的顶点坐标),那么分组后,我们可以这样生成每个组的外接矩形: ```python import cv2 import numpy as np # 假设group_masks是一个组内所有目标的掩码轮廓列表(每个掩码轮廓是一个np数组,点集) # 步骤1:创建一个空图像,绘制所有掩码(合并) merged_contour = None # 或者:创建一个空白画布,将所有掩码轮廓绘制上去(填充),然后得到合并区域的轮廓 # 由于我们可能只有轮廓点,没有整个掩码图像,我们可以考虑将多个轮廓合并成一个轮廓(取并集)比较复杂,替代方法:绘制所有多边形并填充,然后找整个区域的轮廓 # 假设我们有一个组内所有目标的掩码轮廓列表:group_contours # 创建一个足够大的空白图像(二值) canvas = np.zeros((image_height, image_width), dtype=np.uint8) for contour in group_contours: # 注意:contour是一个点集,形状为(n,1,2)(n,2) if contour.ndim == 2: contour = contour.reshape((-1,1,2)).astype(np.int32) cv2.drawContours(canvas, [contour], -1, 255, thickness=cv2.FILLED) # 现在canvas上有了整个组的区域(白色),然后我们找这个区域的轮廓 contours, _ = cv2.findContours(canvas, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE) if contours: # 取面积最大的轮廓(即整个组) merged_contour = max(contours, key=cv2.contourArea) # 使用boundingRect得到外接矩形 x, y, w, h = cv2.boundingRect(merged_contour) group_rect = (x, y, x+w, y+h) # 或者保持(x,y,w,h)格式,根据需求 else: group_rect = (0,0,0,0) # 没有找到轮廓,设置默认值 ``` 但是,这个方法需要原始图像的尺寸(image_height, image_width),并且在绘制掩码时需要知道这些掩码在图像中的位置。 ### 注意事项 1. 如果用户只有矩形框(没有掩码),那么无法使用轮廓法,因为矩形框只能提供矩形区域,而不能提供目标的精确形状。在这种情况下,使用坐标极值法(方案1)是合适的。 2. 引用[1]中的代码展示了如何从YOLO的掩码(多边形)得到每个目标的外接矩形(使用`cv2.boundingRect`),但这只是单个目标的矩形,不是组的矩形。 3. 如果用户确实只有矩形框(没有掩码),但又希望得到紧凑的组矩形,可以考虑另一种方法:将组内每个矩形框的四个顶点合并成一个点集,然后对这个点集求最小外接矩形(轴对齐或旋转)。对于轴对齐矩形,可以直接取所有顶点的最小和最大坐标;对于旋转矩形,可以使用`cv2.minAreaRect`(引用[4])。 ### 使用`cv2.minAreaRect`得到旋转矩形(即使没有掩码) 如果我们只有矩形框(每个目标的外接矩形),我们可以将组内所有目标的矩形框的四个顶点合并成一个点集(注意:每个矩形有4个点,所以一个组有4*n个点)。然后,使用`cv2.minAreaRect`计算这些点的最小外接旋转矩形。步骤: ```python # 假设group_rects是一个组内所有目标的矩形框列表,每个矩形框表示为(x_min, y_min, x_max, y_max) # 或者表示为四个顶点(如引用[1]中的rect = [[x, y], [x, y+h], [x+w, y+h], [x+w, y]]) # 将每个矩形框的四个顶点加入点集 points = [] for rect in group_rects: # 如果矩形表示为(x_min, y_min, x_max, y_max) x_min, y_min, x_max, y_max = rect points.append([x_min, y_min]) points.append([x_min, y_max]) points.append([x_max, y_min]) points.append([x_max, y_max]) # 或者如果矩形已经表示为四个顶点,则直接添加 # 将点集转换为numpy数组 points = np.array(points, dtype=np.float32) # 注意minAreaRect要求为float32 # 计算最小外接旋转矩形 rotated_rect = cv2.minAreaRect(points) # 获取旋转矩形的四个顶点 box_points = cv2.boxPoints(rotated_rect) box_points = np.int0(box_points) # 转换为整数 ``` 这样,我们就得到了整个组的旋转矩形。但是,旋转矩形在后续处理中可能不如轴对齐矩形方便(例如在YOLO格式中通常使用轴对齐矩形)。 ### 总结 - 如果只有矩形框数据,并且希望得到轴对齐的组矩形,使用坐标极值法(方案1)最为简单高效。 - 如果有掩码数据,并且希望得到精确的轴对齐矩形,可以使用轮廓合并后`cv2.boundingRect`(方案2)。 - 如果希望得到旋转矩形(无论是否有掩码),并且只有矩形框数据,可以将每个目标的矩形顶点合并后使用`cv2.minAreaRect`。 在用户的问题中,他们使用的是YOLO检测得到的目标中心位置和外接矩形(没有提到掩码),因此我们最初使用的坐标极值法是合适的。但是,如果用户希望得到更紧凑的矩形,可以考虑使用旋转矩形(虽然YOLO通常使用轴对齐矩形)。 ### 针对用户问题的建议 由于用户没有提到掩码,我们假设他们只有外接矩形。因此,在分组后生成新外接矩形时,使用最初方案(坐标极值法)即可。如果用户希望使用`boundingRect`,那么他们需要提供掩码信息(如引用[1]中那样)。 ### 相关问题 §§相关问题§§ 1. 如何根据YOLO检测结果获取目标的掩码(mask)信息? 2. 在目标分组后,使用`cv2.boundingRect`和`cv2.minAreaRect`生成的外接矩形有何区别?如何选择? 3. 如果只有目标的外接矩形框(没有掩码),如何优化分组后的外接矩形以减少背景区域? </think>基于您的需求和引用内容,我将详细解释`cv2.boundingRect`函数在YOLO检测目标分组场景中的使用方法,特别关注其在生成新外接矩形时的应用。 ### `cv2.boundingRect`的核心功能 `cv2.boundingRect`是OpenCV中用于计算轮廓最小外接矩形的关键函数: 1. **输入**:轮廓点集(多边形顶点坐标) 2. **输出**:轴对齐矩形(非旋转)的坐标`(x, y, width, height)` 3. **数学原理**: $$ \begin{align*} x &= \min(p_i^x) \\ y &= \min(p_i^y) \\ w &= \max(p_i^x) - x \\ h &= \max(p_i^y) - y \\ \end{align*} $$ 其中$p_i$为轮廓点坐标[^4] ### 在YOLO目标分组中的使用场景 在您描述的"检测目标分组后生成新外接矩形"场景中,`boundingRect`有两种典型应用方式: #### 1. 基于轮廓点集直接生成组矩形(推荐) ```python import cv2 import numpy as np # 假设group_contour是分组后目标的合并轮廓 group_contour = np.array([[x1,y1], [x2,y2], ...], dtype=np.int32) # 计算组的最小外接矩形 x, y, w, h = cv2.boundingRect(group_contour) group_rect = (x, y, x+w, y+h) # 转换为(x_min, y_min, x_max, y_max)格式 ``` *适用场景*:当您能获取组内所有目标的完整轮廓点时(如引用[1]中的掩码处理流程) #### 2. 基于现有矩形生成组矩形 ```python # 假设group_rects是组内各目标的现有矩形列表 x_mins = [r[0] for r in group_rects] y_mins = [r[1] for r in group_rects] x_maxs = [r[2] for r in group_rects] y_maxs = [r[3] for r in group_rects] # 直接计算组矩形(无需boundingRect) group_rect = (min(x_mins), min(y_mins), max(x_maxs), max(y_maxs)) ``` *适用场景*:当只有矩形框数据时(如标准YOLO检测输出),效率更高[^4] ### 关键选择依据 | 方法 | 所需数据 | 精度 | 性能 | 适用场景 | |------|----------|------|------|----------| | 轮廓点集 | 目标完整轮廓 | 高 | 中 | 有掩码数据(如引用[1]) | | 矩形合并 | 现有矩形框 | 中 | 高 | 标准检测框输出 | ### 实际应用建议 1. **数据准备**: ```python # 从YOLO结果获取轮廓(如引用[1]) contours = [] for mask in result.masks.xy: contours.append(np.array(mask, dtype=np.int32)) ``` 2. **分组后处理**: ```python # 合并组内轮廓 group_points = np.vstack([contours[i] for i in group_indices]) # 计算组外接矩形 x, y, w, h = cv2.boundingRect(group_points) ``` 3. **旋转场景扩展**: ```python # 如需处理旋转目标(如引用[4]) rotated_rect = cv2.minAreaRect(group_points) box_points = cv2.boxPoints(rotated_rect) ``` ### 性能优化技巧 1. 优先使用矩形合并法(无轮廓计算) 2. 对大型轮廓使用`cv2.convexHull`简化 3. 并行处理不同组(如引用[5]的轻量化思路) 在实际工程中,当处理分组后的目标集合时,若已有目标的精确轮廓,推荐使用`boundingRect`生成紧凑的外接矩形;若只有矩形框数据,直接坐标极值计算更高效[^1][^4]。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值