图像处理理论、应用与实验
1、计算机视觉概览
- 计算机视觉是一门让计算机如何像人一样看懂图片的学科,其输入是图像,输出是对图像的处理和理解
- 计算机视觉是计算机三大技术方向中最成熟的,其他两大方向分别是:自然语言处理、语音处理
- 计算机视觉的应用

- 计算机视觉的核心功能

2、数字图像处理基础
→一幅图像是怎么形成的
2.1、图像的感知和获取
通过光敏传感器来获取图像,光敏传感器可以获取图像的场景元素,场景元素经过成像系统得到数字化的图像。描述传感器的性能包括传感器的单元数、尺寸以及性能
2.2、图像数字化
多数传感器的输出是连续的电压波形,图像数字化是将连续色调的图像转换为计算机能够处理的数字影像的过程。图像数字化包括两种处理过程:采样和量化。
2.2.1、采样
- 图像数字化的采样过程是将空间上连续的图像变化为离散的点。 采样后得到离散图像的尺寸称为图像分辨率。分辨率由宽(width)和高(height)两个参数构成。宽表示水平方向的细节数,高表示垂直方向的细节数。 例如:
- 一幅640* 480分辨率的图像,表示这幅图像是由640*480=307200个点组成。
- 一幅1920* 1080分辨率的图像,表示这幅图像是由1920*1080= 2073600个点组成。
- 采样间隔越小,所得图像像素数越多,空间分辨率高,图像质量好,但数据量大

2.2.2、量化
- 数字图像处理的量化过程是将采样点的传感器信号转换成离散的整数值。 量化后得到离散图像的每个采样点的变化范围称为灰度级(Gray level scale)。灰度级通常是2的整数次幂。我们用m级或者n位来表示灰度级。图像数据的灰度级越多视觉效果就越好,层次越丰富。计算机中最常用的是8位图像。 例如:
- 一幅8位的图像,表示每个采样点有2^8=256级。也就是说每一个采样点从最暗到最亮,可以分辨256个级别。
- 一幅32级的灰度图像,每个采样点从最暗到最亮,可以分辨32个级别。

2.3、数字图像的表示
- 取样和量化后的数字图像在数学上表示为一个矩阵。矩阵的每一个点都描述了被量化的强度,其宽和高表示图像分辨率的宽和高。
- 对于灰度图像,其图像是一个0到灰度级的整数。

- 数字图像中的每一个采样点,被称之为像素(Pixel)。像素可以由它在图像中的位置坐标(𝑥,𝑦)来描述。 像素的数据维度被称为通道(Channel)。描述彩色图像需要多通道。

2.3.1、灰度图
灰度图像的表示是在样本点上标注它的灰度值,0表示最暗,255表示最亮。

2.3.2、彩色图像
RGB

HSV
H:色相,颜色的相位角,范围0-356°,不同色相值对应不同的颜色
S:饱和度,0-1,越靠近远点,饱和度越低
V:亮度,0-1,越靠近0越暗,越尖越暗
相比于RGB,HSV所能包含的颜色空间更大,颜色更多

其他色彩空间

2.3.2、颜色空间的转换

2.3.4、图像灰度化

2.3.5、像素关系

- 以上可以明显看到 8-邻域=4-邻域+对角邻域
2.3.6、像素的连接
条件:
1、像素是否是在邻域中的
2、像素值相等或者像素值在一个灰度集合V中

2.3.7、像素的连通
-
通路

像素连通的应用:我们常常使用像素的连通来画出图像的轮廓 -
连通域

2.3.8、距离度量
以上说的领域、连通和连通域都是像素的空间度量,那么如何度量这个空间的大小呢,这个时候需要有距离的度量。主要包括:

2.3.9、图像的计算(这里先介绍算数运算)
- 数字图像是由矩阵表示的,一切矩阵的计算都适用于图像,但是按照实际意义,图像的计算一般分为算数运算(点操作)和坐标变换(集合操作)
- 算数运算是通过一些运算规则,包括加减乘除和逻辑运算,改变像素点的灰度值来实现一些像素变化的应用
- 坐标变换是通过像素点的几何坐标变换来改变像素的位置以实现特定的应用。这个知识点会在图像预处理中讲到。
- 应用
1、对多幅图像的加法求均值,可以达到去噪声的效果;图像的加法可以实现图像添加水印

2、对连续的图像的减法可以去除背景,还可以检测图像是否有运动的物体

3、图像预处理技术
3.1、图像处理的形式

3.2、图像预处理

3.2.1、图像的灰度变换
3.2.1.1、基于原图的图像灰度变换

- 反转
- 对比度增强(中间变大两边变小)
对比度增强就是把s1-s2之间(中间部分)的灰度值映射到d1-d2这个更大的的灰度值当中,而把边缘部分的灰度值映射到一个更小的灰度值范围内,其效果就是白的地方更白,黑的地方更黑。
- 对比度压缩(中间变小两边变大)
把中间部分映射到灰度值更小的一个范围内,而两边部分映射到一个灰度值更大的范围内,达到白的地方变暗,黑的地方变亮。

本文详细探讨了图像处理基础、计算机视觉概览,涉及采样、量化、颜色空间转换、图像预处理技术(如灰度变换、滤波、坐标变换)、基本任务如图像分类、目标检测等。深入讲解了特征提取、传统算法如HOG、LBP,以及深度学习和CNN在图像识别中的应用。


最低0.47元/天 解锁文章

908

被折叠的 条评论
为什么被折叠?



