OpenCV

原创已于 2025-12-20 21:32:23 修改 · 812 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#OpenCV

于 2010-12-30 14:20:00 首次发布

多媒体专栏收录该内容

5 篇文章

订阅专栏

PyTorch 2.5

PyTorch

Cuda

PyTorch 是一个开源的 Python 机器学习库，基于 Torch 库，底层由 C++ 实现，应用于人工智能领域，如计算机视觉和自然语言处理

形态学分析

形态学分析操作主要从图像内提取分量信息，用于表达和描绘图像分量的形状，通常是图像理解时所使用的最本质的形状特征。

形态学分析中使用的结构元素与卷积的filter2D中的自定义滤波器相似，不同的是结构元素只有0或者1两个值，无须浮点数赋值，因为形态学本质上是基于像素的结构化操作，而不是线性组合的点乘计算。

腐蚀和膨胀的概念是基于对背景深色和前景浅色的图片，是对其前景分量的操作的概念。

腐蚀：用结构元素窗口内的最小像素值替换锚定点(默认为中心像素点)的像素值。结果是缩小了前景分量，扩大了背景分量，同时起到了消除和减小背景分量中的噪点噪线。

膨胀：用结构元素窗口内的最大像素值替换锚定位置(默认为中心位置)的像素值。结果是缩小了背景分量，扩大了前景分量，同时起到了消除和减小前景分量中的噪点噪线。

开运算：将图像先腐蚀，再继续膨胀。即先腐蚀前景同时背景去噪，再还原前景图像大小。

闭运算：将图像先膨胀，再继续腐蚀。即先膨胀前景同时前景去噪，再还原前景图像大小。

梯度运算：用膨胀图片减腐蚀图像，得到原图中前景的边缘。

礼帽运算：用原始图像减去其开运算图像，获取图像中背景内的噪声信息，或者得到比原始图像前景的边缘更亮的边缘信息。

黑帽运算：用闭运算图像减去原始图像，获取图像中前景内的噪声信息，或者得到比原始图像前景边缘更暗的边缘部分。

图像梯度

图像梯度计算的是图像的边缘信息。Sobel 算子、Scharr 算子、Laplacian 算子都可以用作边缘检测。

Canndy边缘检测

Canny 边缘检测分为如下几个步骤。
步骤 1:去噪。噪声会影响边缘检测的准确性，因此首先要将噪声过滤掉。

步骤 2:计算梯度的幅度与方向。
步骤 3:非极大值抑制，即适当地让边缘“变瘦”。
步骤 4:确定边缘。使用双阈值算法确定最终的边缘信息。

图像金字塔

图像金字塔是由一幅图像的多个不同分辨率的子图所构成的图像集合。该组图像是由单个图像通过不断地降采样所产生的，最小的图像可能仅仅有一个像素点。图像金字塔是一系列以金字塔形状排列的、自底向上分辨率逐渐降低的图像集合。

图像轮廓

图像轮廓是指将边缘连接起来形成的一个整体，用于后续的计算。通过对图像轮廓的操作，能够获取目标图像的大小、位置、方向等信息。

获取图像轮廓需要的原始图像是8 位单通道二值图像。

轮廓拟合

在计算轮廓时，可能并不需要实际的轮廓，而仅需要一个接近于轮廓的近似多边形。 OpenCV 提供了多种计算轮廓近似多边形的方法。

凸包

逼近多边形是轮廓的高度近似，但是有时候，我们希望使用一个多边形的凸包来简化它。凸包跟逼近多边形很像，只不过它是物体最外层的“凸”多边形。凸包指的是完全包含原有轮廓，并且仅由轮廓上的点所构成的多边形。凸包的每一处都是凸的，即在凸包内连接任意两点的直线都在凸包的内部。在凸包内，任意连续三个点的内角小于 180°。

例如，机械手图像最外层的多边形为机械手的凸包，在机械手边缘与凸包之间的部分被称为凸缺陷(Convexity Defect)，凸缺陷能够用来处理手势识别等问题。

直方图

从统计的角度讲，直方图是图像内灰度值的统计特性与图像灰度值之间的函数，直方图统计图像内各个灰度级出现的次数。从直方图的图形上观察，横坐标是图像中各像素点的灰度级，纵坐标是具有该灰度级(像素值)的像素个数。

直方图均衡化

如果一幅图像拥有全部可能的灰度级，并且像素值的灰度均匀分布，那么这幅图像就具有高对比度和多变的灰度色调，灰度级丰富且覆盖范围较大。在外观上，这样的图像具有更丰富的色彩，不会过暗或过亮。

傅里叶变换

图像处理一般分为空间域处理和频率域处理。

空间域处理是直接对图像内的像素进行处理。空间域处理主要划分为灰度变换和空间滤波两种形式。灰度变换是对图像内的单个像素进行处理，比如调节对比度和处理阈值等。空间滤波涉及图像质量的改变，例如图像平滑处理。空间域处理的计算简单方便，运算速度更快。

频率域处理是先将图像变换到频率域，然后在频率域对图像进行处理，最后再通过反变换将图像从频率域变换到空间域。

对图像进行傅里叶变换后，得到图像中的低频和高频信息。低频信息对应图像内变化缓慢的灰度分量。高频信息对应图像内变化越来越快的灰度分量，是由灰度的尖锐过渡造成的。例如，在一幅大草原的图像中有一头狮子，低频信息就对应着广袤的颜色趋于一致的草原等细节信息，而高频信息则对应着狮子的轮廓等各种边缘及噪声信息。

模板匹配

模板匹配是指在当前图像 A 内寻找与图像 B 最相似的部分，一般将图像 A 称为输入图像，将图像 B 称为模板图像。模板匹配的操作方法是将模板图像 B 在图像 A 上滑动，遍历所有像素以完成匹配。

霍夫变换

霍夫变换是一种在图像中寻找直线、圆形以及其他简单形状的方法。霍夫变换采用类似于投票的方式来获取当前图像内的形状集合，该变换由 Paul Hough(霍夫)于 1962 年首次提出。最初的霍夫变换只能用于检测直线，经过发展后，霍夫变换不仅能够识别直线，还能识别其他简单的图形结构，常见的有圆、椭圆等。霍夫直线变换用来在图像内寻找直线，霍夫圆变换用来在图像内寻找圆。

图像分割与提取

分水岭算法实现图像分割与提取

GrabCut 算法对图像进行分割及提取

K 近邻算法

K 近邻算法是最简单的机器学习算法之一，主要用于将对象划分到已知类中。K 近邻算法的本质是将指定对象根据已知特征值分类。

计算距离

用绝对值之和表示的距离，称为曼哈顿距离

计算平方和的平方根，这种距离就是被广泛使用的欧氏距离

支持向量机

支持向量机(Support Vector Machine，SVM)是一种二分类模型，目标是寻找一个标准(称为超平面)对样本数据进行分割，分割的原则是确保分类最优化(类别之间的间隔最大)。当数据集较小时，使用支持向量机进行分类非常有效。支持向量机是最好的现成分类器之一，这里所谓的“现成”是指分类器不加修改即可直接使用。

在对原始数据分类的过程中，可能无法使用线性方法实现分割。支持向量机在分类时，把无法线性分割的数据映射到高维空间，然后在高维空间找到分类最优的线性分类器。

K均值聚类

根据训练数据是否有标签，可以将学习划分为监督学习和无监督学习。K 近邻、支持向量机都是监督学习，提供有标签的数据给算法学习，然后对数据分类。而聚类是无监督学习，事先并不知道分类标签是什么，直接对数据分类。

人脸识别

人脸识别是指程序对输入的人脸图像进行判断，并识别出其对应的人的过程。要实现人脸识别，首先要人脸检测，只有检测到图像中出现了人脸，才能根据人脸判断这个人到底是谁。

当预测的是离散值时，进行的是“分类”。对于只涉及两个类别的“二分类”任务，通常将其中一个类称为“正类”(正样本)，另一个类称为“负类”(反类、负样本)。例如，在人脸检测中，主要任务是构造能够区分包含人脸实例和不包含人脸实例的分类器。这些实例被称为“正类”(包含人脸图像)和“负类”(不包含人脸图像)。

您可能感兴趣的与本文相关的镜像

PyTorch 2.5

PyTorch

Cuda

PyTorch 是一个开源的 Python 机器学习库，基于 Torch 库，底层由 C++ 实现，应用于人工智能领域，如计算机视觉和自然语言处理