【读书笔记】《数字图像处理》（第三版）-第2章数字图像基础_设g(x,y)为无噪声图像f(x,y)被噪声图像η(x,y)污染后的图像, 即: g(x,y) = -优快云博客

本文链接：https://blog.youkuaiyun.com/u014556728/article/details/52529758

本文是《数字图像处理》第三版的读书笔记，重点介绍图像的基础概念，包括图像的表示、取样与量化。讨论了灰度级、动态范围、空间分辨率和灰度分辨率等核心概念，并介绍了内插方法，如最近邻、双线性和双三次内插。此外，还探讨了像素间的关系，如连通集和区域，以及图像的算术操作和仿射变换。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

一.图像感知
1.1 除了频率外，三个描述彩色光源质量的基本量：
（1）发光强度：是从光源流出能量的总量，通常用瓦特（ $W$ ）来度量；
（2）光通量：观察者从光源感受到的能量，用流明数（ $lm$ ）度量；
（3）亮度：是光感知的主观描绘，它实际上不可度量。它体现了强度的无光概念，是描述彩色感觉的参数之一。

1.2 用二维函数 $f(x,y)$ 来表示图像。 $f(x,y)$ 可由两个分量来表征：
（1）入射分量 $i(x,y)$ ：入射到被观察场景的光源照射总量；
（2）反射分量 $r(x,y)$ ：场景中物体所反射的光照总量。

f (x, y) = i (x, y) r (x, y)

$f(x,y)=i(x,y)r(x,y)$
其中

0 < i (x, y) < \infty

$0<i(x,y)<∞$

i(x,y) $i(x,y)$ 的性质取决于照射源，

r(x,y) $r(x,y)$ 的性质取决于成像物体的性质。

1.3 单色图像在任何坐标 $(x_0,y_0)$ 处的强度（灰度）表示为 $l=f(x_0,y_0)$ ， $l$ 的取值范围为 $L_{min}≤l≤L_{max}$ ，区间 $[L_{min},L_{max}]$ 即为灰度级（或强度级）。

二.图像取样与量化
2.1 数字图像需将连续的 $f(x,y)$ 离散化，对坐标值离散化称为取样，对幅值离散化称为量化。

2.2 灰度级数典型地取为2的整数次幂，即 $L=2^k$ 。离散灰度级是等间隔的，且他们是区间 $[0,L-1]$ 内的整数。可将灰度跨越的值域非正式地称为动态范围。图像系统的动态范围定义为系统中最大可度量灰度与最小可检测灰度之比，其上限取决于饱和度，下限取决于噪声。

2.3 对比度与动态范围有紧密的联系，其定义为一副图像中最高和最低灰度级之间的灰度差。当一幅图像中像素可感知的数值有高的动态范围时，我们认为该图像具有高的对比度。

2.4 空间分辨率是图像中可辨别的最小细节的度量。其中每单位距离线对数和每单位距离点数（像素数）是最通用的度量。

2.5 灰度分辨率是指灰度级中可分辨的最小变化。

2.6 内插是用已知数据来估计未知位置的数值的处理，是在诸如放大、收缩、旋转和几何校正等任务中广泛应用的基本工具，是基本的图像重取样方法。

2.7 最近邻内插法：这种方法把原图像中最近邻的灰度赋给了每个新位置。这种方法简单但有许多缺陷，如某些直边缘的严重失真，因此该方法并不常用。

2.8 双线性内插法：用4个最近邻点去估计给定位置的灰度。其公式为

v (x, y) = a x + b y + c x y + d

$v(x,y)=ax+by+cxy+d$

2.9 双三次内插法：用16个最近邻点去估计给定位置的灰度。其公式为

v (x, y) = \sum i = 0 3 \sum j = 0 3 a i j x i y j

$v(x,y)=\sum_{i=0}^3\sum_{j=0}^3a_{ij}x^iy^j$

三.像素间的基本关系
3.1 对于图像中的一个像素子集S中的任何像素P，S中连通到该像素的像素集称为S的连通量。如果S仅有一个连通分量，则集合S称为连通集。

3.2 如果图像中的一个像素子集R是连通集，则称R为一个区域。两个区域，如果它们联合形成一个连通集，则区域Ri和Rj称为邻接区域。不邻接的区域称为不连接区域。

3.3 图像间的算术操作：算术操作是阵列操作，即是像素间的算术操作。如下几个例子：
（1）针对降噪的带噪图像相加（平均）： $g(x,y)$ 是原图像 $f(x,y)$ 被加性噪声
$η(x,y)$ 污染后的图像，即

g (x, y) = f (x, y) + η (x, y)

$g(x,y)=f(x,y)+η(x,y)$
对多幅同一场景的图像进行平均，即

g ¯ (x, y) = 1 k \sum i = 1 k g i (x, y)

$\overline g(x,y)={1\over k}\sum_{i=1}^k g_i(x,y)$
遵循

E {g ¯ (x, y)} = f (x, y)

$E\{\overline g(x,y)\}=f(x,y)$
和

σ 2 g ¯ (x, y) = 1 k σ 2 η (x, y)

$σ_{\overline g(x,y)}^2={1\over k} σ_{η(x,y)}^2$
即随着K的增大，每个位置(x,y)的像素值变化将减小。
（2）增强差别的图像相减：将一幅图像减去另一幅图像，则清楚地显示他们的差别，即

g (x, y) = f (x, y) - h (x, y)

$g(x,y)=f(x,y)-h(x,y)$
这个操作的目的是为了增强细节。
（3）使用图像相乘和相除来校正阴影：假设一个成像传感器产生可由

f(x,y) $f(x,y)$ 表示的完美图像与阴影函数

h(x,y) $h(x,y)$ 的乘积来建模的图像，即

g (x, y) = f (x, y) h (x, y)

$g(x,y)=f(x,y)h(x,y)$
如果

h(x,y) $h(x,y)$ 已知，那么我们可以使用

h(x,y) $h(x,y)$ 的反函数乘以感知图像的方法得到

f(x,y) $f(x,y)$ ，即

f (x, y) = g (x, y) / (h (x, y)

$f(x,y)=g(x,y)⁄(h(x,y)$
如果

h(x,y) $h(x,y)$ 未知，但图像系统可以访问，我们可以通过对具有恒定灰度的目标成像得到一个近似的阴影函数。

四.空间操作
4.1 仿射变换： $(v,w)$ 是原图像中像素的坐标， $(x,y)$ 是变换后图像中像素的坐标，一般形式为

[x y 1] = [v w 1] T = [v w 1] ⎡ ⎣ ⎢ t 11 t 21 t 31 t 12 t 22 t 32 000 ⎤ ⎦ ⎥

$\begin{bmatrix} x & y & 1\\ \end{bmatrix} = \begin{bmatrix} v & w & 1 \end{bmatrix} T = \begin{bmatrix} v & w & 1 \end{bmatrix} \begin{bmatrix} t_{11} & t_{12} & 0 \\ t_{21} & t_{22} & 0 \\ t_{31} & t_{32} & 0 \\ \end{bmatrix}$
有两种基本方法来进行仿射变换：
（1）前向映射：扫描输入图像的像素，每个位置

(x,w) $(x,w)$ 直接计算相应像素

(x,y) $(x,y)$ 。这个方法第一个问题是有可能会有多个像素变换到输出图像的同一位置；第二是某些输出位置并不存在。
（2）反向映射：扫描输出像素的位置，在每一个位置

(x,y) $(x,y)$ 使用