数字图像处理
文章目录
绪论
概念
一副图像可定义为一个二维函数 f ( x , y ) f(x,y) f(x,y),其中 x x x和 y y y是空间平面的坐标,而幅值 f f f成为图像在该点处的强度和灰度。
- 当 x x x、 y y y和 f f f是有限的离散数值时,我们称图像为数字图像。
- 数字图像处理是指借助于数字计算机来处理数字图像。
从图像处理到计算机视觉的这个连续统一体内并没有明确的界限。然而,一种有用的范例是在这个连续的统一体中考虑三种典型的计算处理,即低级、中级和高级处理。
- 低级处理涉及初级操作如降低噪声的图像预处理、对比度增强和图像尖锐化。低级处理以输入、输岀都是图像为特征。中级处理涉及诸多任务,譬如把一幅图像分为不同区域或目标的)分割,减少这些目标物的描述,以使其更适合计算机处理及对不同目标的分类(识别)。
- 中级图像处理以输入为图像但输出是从这些图像中提取的特征(如边缘、轮廓及各物体的标识等)为特点。
- 高级处理涉及“理解”已识别目标的总体,就像在图像分析中那样,以及在连续统一体的远端执行与视觉相关的认知功能。
用途
- 伽马射线成像
- X射线成像
- 紫外波段成像
- 可见光及红外波段成像
- 微波波段成像
- 无线电波段成像
基本步骤
- 图像获取与给出一幅数字形式的图像一样简单。包括图像预处理,譬如图像缩放。
- 图像增强是对一幅图像进行某种操作,使其结果在特定应用中比原始图像更适合进行处理。
- 图像复原是改进图像外观的一个处理领域。与图像增强不同的是,图像增强是主观的,而图像复原是客观的。复原技术倾向于以图像退化的数学或概率模型为基础。另一方面,增强的效果是以人的主观判断为基础的。
- 彩色图像处理也是提取图像中感兴趣特征的基础
- 小波是以不同分辨率来描述图像的基础。
- 形态学处理设计提取图像分享的工具。
- 分割过程将一幅图像划分为他的组成部分或目标。自动分割是数字图像处理中最困难的任务之一。
- 表示与描述几乎总是在分割阶段的输出之后,通常这一阶段是未加工的像素数据,这些数据不是构成一个区域的边界,就是构成该区域本身的所有点。
- 识别是基于目标的描述给该目标赋予标志的过程。
组成
数字图像基础
视觉感知要素
视网膜图像主要聚焦在中央凹区域。然后,光接收器的相对刺激作用产生感知,把辐射能转变为电脉冲,最后由大脑解码。
图像感知和获取
取样和量化
一幅图像的x和y坐标及幅度可能都是连续的。为将它转换为数字形式,必须在坐标上和幅度上都进行取样操作。对坐标值进行数字化称为取样,对幅值数字化称为量化。
空间分辨率是图像中可辨别的最小细节的度量。其中每单位距离线对数和每单位距离点数(像素数)是最通用的度量。
灰度分辨率是指在灰度级中可分辨的最小变化
图像内插
- 最近邻内插法。这种方法把原图像中最近邻的灰度赋给了每个新位置
- 双线性内插(不是线性)
v
(
x
,
y
)
=
a
x
+
b
y
+
c
x
y
+
d
v(x,y)=ax+by+cxy+d
v(x,y)=ax+by+cxy+d其中,4个系数可由4个用
(
x
,
y
)
(x,y)
(x,y)点最近邻点写出的未知方程确定。
- 双线性内插给出了比最近邻内插好得多的结果,但随之而来的是计算量的增加。
- 双三次内插
v
(
x
,
y
)
=
∑
i
=
0
3
∑
j
=
0
3
a
i
j
x
i
y
j
v(x,y)=\sum_{i=0}^{3}\sum_{j=0}^{3}a_{ij}x^iy^j
v(x,y)=∑i=03∑j=03aijxiyj
- 16个系数可由16个用 ( x , y ) (x,y) (x,y)点最近邻点写出的未知方程确定。如果求和的上下限分别为0和1,则其简化为双线性内插的形式。
- 通常,双三次内插在保持细节方面比双线性内插相对要好。双三次内插是商业图像编辑程序的标准内插方法。
- 样条、小波
像素的一些基本关系
三种类型的邻接
- 4邻接。如果q在集合 N 4 ( p ) N4(p) N4(p)中,则具有V中数值的两个像素p和q是4邻接的。
- 8邻接。如果q在集合 N 3 ( p ) N3(p) N3(p)中,则具有V中数值的两个像素p和q是8邻接的。
- m m m邻接(混合邻接)。如果 q q q在 N 4 ( p ) N4(p) N4(p)中,或 q q q在 N D ( p ) N_D(p) ND(p)(p的四个对角相邻像素)中,且集合 N 4 ( p ) ∩ N 4 ( q ) N4(p)∩N4(q) N4(p)∩N4(q)中没有来自 V V V中数值的像素,则具有 v v v中数值的两个像素 p p p和 q q q是 m m m邻接的。
混合邻接是8邻接的改进。混合邻接的引入是为了消除采用8邻接时产生的二义性。
距离度量
数字图像处理中所用数学工具
灰度变换和空间滤波
基础
滤波器又称 空间滤波器、空间掩膜、核、模板、窗口
一些基本的灰度变换函数
s和r分别代表处理前后的像素值。
图像反转
s = L − 1 − r s=L-1-r s=L−1−r
对数变换
s = c l o g ( 1 + r ) s = clog(1+r) s=clog(1+r)
幂律(伽马)变换
s = c ( r + ε ) γ s=c(r+ \varepsilon)^{\gamma} s=c(r+ε)γ
通常 ε \varepsilon ε为0
分段线性变换函数
-
对比度拉伸
-
灰度级分层
-
比特平面分层
很明显,4个高阶比特平面,特別是最后两个比特平面,包含了在视觉上很重要的大多数数据。低阶比特平面在图像中贡献了更精细的灰度细节。
图 3.14 ( a ) 3.14(a) 3.14(a)的最低边界的中部。从最高阶平面开始,这些比特平面中的相应像素的值分别为11000010,它是十进制数194的二进制表示。原图像中任意一个像素的值,可以类似地由这些比特平面中对应的二进制像素值来重建
我们可以得出这样的结论:存储4个高阶比特平面将允许我们以可接受的细节来重建原图像。存储这4个平面代替原始图像可减少50%的存储量(不考虑存储体系结构问题)
直方图处理
直观上,可以得出这样的结论:若一幅图像的像素倾向于占据整个可能的灰度级并且分布均匀,则该图像会有高对比度的外观并展示灰色调的较大变化。最终效果将是一幅灰度细节丰富且动态范围较大的图像。
-
PDF:概率密度函数(probability density function), 在数学中,连续型随机变量的概率密度函数(在不至于混淆时可以简称为密度函数)是一个描述这个随机变量的输出值,在某个确定的取值点附近的可能性的函数。
-
PMF : 概率质量函数(probability mass function), 在概率论中,概率质量函数是离散随机变量在各特定取值上的概率。
-
CDF : 累积分布函数 (cumulative distribution function),又叫分布函数,是概率密度函数的积分,能完整描述一个实随机变量X的概率分布。
灰度级范围为 [ 0 , L − 1 ] [0,L-1] [0,L−1]的数字图像的直方图是离散函数 h ( r k ) = n k h(r_k)=n_k h(rk)=nk,其中 r k r_k rk是第 k k k级灰度值, n k n_k nk是图像中灰度为的像素个数。

直方图均衡化
剩下的看书看的不太懂了,看了以下的博客
滤波基础
滤波一词借用于频域处理,频率域处理是下一章的主题,在下一章中,“滤波”是指接受(通过)或拒绝一定的频率分量。例如,通过低频的滤波器称为低通滤波器。低通滤波器的最终效果是模糊(平滑)一幅图像。我们可以用空间滤波器(也称为空间掩模、核、模)直接作用于图像本身而完成类似的平滑。
一般来说,使用大小为 m ∗ n m*n m∗n的滤波器对大小为 M ∗ N M*N M∗N的图像进行线性空间滤波,可由下式表示
相关和卷积
相关是滤波器模板移过图像并计算每个位置乘积之和的处理。卷积的机理相似,但滤波器首先要旋转180°。
平滑空间滤波器
平滑滤波器用于模糊处理和降低噪声。
模糊处理经常用于预处理任务中,例如在(大)目标提取之前去除图像中的一些琐碎细节,以及桥接直线或曲线的缝隙。通过线性滤波和非线性滤波模糊处理可以降低噪声。
平滑线性滤波器
平滑线性空间滤波器的输出(响应)是包含在滤波器模板邻域内的像素的简单平均值。这些滤波器有时也称为均值滤波器。
傅里叶
如何理解傅里叶变换公式? - 苗华栋的回答 - 知乎 https://www.zhihu.com/question/19714540/answer/1119070975