数字图像处理--冈萨雷斯第4版--第二章 数字图像基础

本文深入探讨了数字图像处理的基础,包括人眼结构与视觉感知,如杆状体和锥状体的不同功能。介绍了人眼中图像的形成,强调了亮度适应与辨别。此外,还涵盖了光和电磁波谱的知识,以及图像的获取方式,如单个传感器、条带传感器和阵列传感器。内容还包括图像取样、量化、分辨率和内插技术,以及像素间的基本关系和数学工具在图像处理中的应用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

第二章 数字图像基础

2.1 视觉感知要素

图像形成并被人类感知的基本原理,并根据数字图像处理时所用的一些要素来了解人类视觉的物理限制

2.1.1 人眼的结构

在这里插入图片描述
人眼的解剖结构
在这里插入图片描述
杆状体和锥状体:两类光感受器

光感受器数量分布位置特性
锥状体600~700万个主要分布在视网膜中央凹对颜色高度敏感;每个锥状体连接自身的神经末梢,肌肉控制眼球转动,使部分区域图像落在中央凹,分辨细节;锥状体视觉被称为明/亮视觉
杆状体7500~1500万个分布面积大捕获视野中的整个图像;没有色觉,对低光照敏感;杆状体视觉被称为暗/微光视觉

2.1.2 人眼中图像的形成

在这里插入图片描述
普通照相机:镜头的焦距固定,通过改变镜头和成像平面之间的距离来实现不同距离的焦距

人眼:晶状体与成像区域(视网膜)之间的距离是固定的,通过改变晶状体的形状得到正确聚焦的焦距

视网膜图像主要聚焦在中央凹区域,光感受器的相对激励作用产生感知,把辐射能量转换为最终由大脑解码的电脉冲

2.1.3 亮度适应与辨别

主观亮度:人类视觉系统感知的亮度

低照明级别,视觉由杆状体执行
高照明级别,视觉由锥状体执行

感知亮度不是实际灰度的简单函数
1.视觉系统往往会在不同灰度区域的边界处出现"下冲"或"上冲"现象,如马赫带现象

2.一个区域的感知亮度并不只是取决于其灰度,如同时对比现象

2.2 光和电磁波谱

波长(λ)和频率(v)的关系
λ = c v \lambda = \frac{c}{v} λ=vc
c = 2.998*10^8 m/s 是光速

电磁波谱各分量的能量为
E = h v E=hv E=hv
电磁波可视为以波长λ传播的正弦波,或视为没有质量的粒子流,每个粒子像波浪一样行进并以光速运动,每个无质量的粒子都是具有一定能量的粒子,频率越高,能量越高。

可见光谱
在这里插入图片描述
感知物体的颜色由物体反射的光的性质决定,例如,绿色物体主要反射波长范围为500~570nm的光,并吸收其他波长的大部分能量

单色光:没有颜色的光,唯一属性是亮度,单色光从黑到白的数值范围通常称为灰度级,单色图像通常称为灰度图像

2.3 图像感知与获取

大多图像的产生:“照射”源和形成图像的“场景”元素对光能的反射或吸收

在某些应用中,反射的能量或透射的能量被聚焦到一个光转换器上,光转换器把能量转换成可见光

在这里插入图片描述
组合输入电能和传感器对正被检测能量的响应,将入射能量转换成电压。输出电压波形是传感器的响应,将传感器响应数字化,得到一个数字量

2.3.1 使用单个传感器获取图像

要使用单个传感器生成二维图像,传感器和成像区域之间必须要有x方向和y方向的相对位移
在这里插入图片描述

2.3.2 使用条带传感器获取图像

在这里插入图片描述

2.3.3 使用阵列传感器获取图像

以二维阵列形式排列各个感测元件
CCD(电荷耦合器件)阵列:可制造成具有较宽范围的传感特性,并能封装成具有更多单元的稳定阵列
在这里插入图片描述

2.3.4 一个简单的成像模型

f(x,y)来表示图像,在某一空间坐标处的f的值是一个标量,与物理源辐射的能量成正比,f(x,y)一定是非负的和有限的
0 ≤ f ( x , y ) < ∞ 0\le f(x,y)<\infty 0f(x,y)<
同时
f ( x , y ) = i ( x , y ) r ( x , y ) f(x,y)=i(x,y)r(x,y) f(x,y)=i(x,y)r(x,y)
0 ≤ i ( x , y ) < ∞ 0\le i(x,y)<\infty 0i(x,y)<
0 ≤ r ( x , y ) < 1 0\le r(x,y)<1 0r(x,y)<1
i(x,y)入射分量,取决于照射源
r(x,y)反射分量,取决于被成像物体的特性,限制在0(全吸收)1(全反射)之间

在投射成像的情况下,r(x,y)是透射分量

2.4 图像取样和量化

2.4.1 取样和量化的基本概念

将一幅连续图像f转换为数字形式

取样(采样):对函数坐标值数字化
量化:对函数幅度值进行数字化

以条带传感器为例
在这里插入图片描述

2.4.2 数字图像表示

1.三维图像表示
2.可视灰度矩阵表示
3.二维数值阵列表示:矩阵中的每一个单元称为图像单元、图像元素或像素
在这里插入图片描述
在这里插入图片描述
MxN的数字图像的中心,M/N除以2后四舍五入最接近的整数得到

离散灰度级数L通常取2的整数次幂
L = 2 k L=2^k L=2k
动态范围:灰度跨越的值域
存储数字图像所需的比特数b:
b = M N k b=MNk b=MNk
当一幅图像具有2^k个可能的灰度级时,我们称该图像是一幅k比特图像
如256级图像称为一幅8比特图像

2.4.3 线性索引和坐标索引

线性索引:由一个一维的非负整数串组成
分为行扫描和列扫描

坐标索引:由二维坐标索引
在这里插入图片描述

2.4.4 空间分辨率和灰度分辨率

空间分辨率:图像中最小可辨别细节的测度

如何定量的说明空间分辨率:使用单位距离线对数和单位距离的点数(像素数)

点数/英寸(dpi):单位距离内可分辨的最大线对数,是印刷和出版业中常用的图像分辨率的测度

空间分辨率的测度必须针对空间单位声明才有意义,如果未声明图像包含的空间维数,那么说一幅图像的分辨率是没有意义的

灰度分辨率:灰度级中可分辨的最小变化,灰度级数通常是2的整数次幂,最常用的数是8比特;灰度分辨率通常是指量化灰度时所用的比特数(如8bit)

空间和灰度分辨率之间可能存在的关系
三类图像的等偏爱曲线
在这里插入图片描述
在这里插入图片描述
等偏爱曲线上的点对应于等主观质量的图像,越接近右上角喜爱程度越高

2.4.5 图像内插

内插:用已知数据来估计未知位置的值的过程

例:如何将大小为500x500像素的一幅图像放大到750x750像素?
最近邻内插:创建一个750x750的假想网格,网格的像素间隔完全于原图像的像素间隔相同,然后收缩网格,使其完全于原图像重叠,收缩后的像素间隔要小于原图像,我们再下伏原图像中找到最接近的像素,并把该像素的灰度赋给750x750网格中的新像素
缺点:会产生人为失真

双线性内插:使用4个最近邻灰度计算给定位置的灰度
v ( x , y ) = a x + b y + c x y + d v(x,y)=ax+by+cxy+d v(x,y)=ax+by+cxy+d
4个系数可由4个最近邻点写出的4个未知方程求出

双三次内插:包括16个最近邻点
v ( x , y ) = ∑ i = 0 3 ∑ j = 0 3 a i j x i y j v(x,y)=\sum_{i=0}^{3} \sum_{j=0}^{3}a_{ij}x^iy^j v(x,y)=i=03j=03aijxiyj

2.5 像素间的一些基本关系

2.5.1 像素的相邻像素

4邻域(N_4( p )):(x+1,y), (x-1,y), (x,y+1), (x,y-1)
4对角相邻像素(N_D( p )):(x+1,y+1), (x+1,y-1), (x-1,y+1), (x-1,y-1)
8邻域:两者之和

2.5.2 邻接、连通、区域、边界

V是用于定义邻接的灰度值集合
三种类型的邻接
在这里插入图片描述
混合邻接示意图
在这里插入图片描述

2.5.3距离测度

欧几里得距离
D e ( p , q ) = [ ( x − u ) 2 + ( y − v ) 2 ] 1 2 D_e(p,q)=[(x-u)^2+(y-v)^2]^\frac{1}{2} De(p,q)=[(xu)2+(yv)2]21
城市街区距离
D 4 ( p , q ) = ∣ x − u ∣ + ∣ y − v ∣ D_4(p,q)=|x-u|+|y-v| D4(p,q)=xu+yv
在这里插入图片描述
棋盘距离
D 8 ( p , q ) = m a x ( ∣ x − u ∣ , ∣ y − v ∣ ) D_8(p,q)=max(|x-u|,|y-v|) D8(p,q)=max(xu,yv)
在这里插入图片描述

2.6 数字图像处理所用的基本数学工具介绍

2.6.1 对应元素运算和矩阵运算

对应元素运算
在这里插入图片描述

矩阵运算
在这里插入图片描述

2.6.2 线性运算与非线性运算

线性运算
H [ f ( x , y ) ] = g ( x , y ) H[f(x,y)]=g(x,y) H[f(x,y)]=g(x,y)
H [ a f 1 ( x , y ) + b f 2 ( x , y ) ] = a H [ f 1 ( x , y ) ] + b H [ f 2 ( x , y ) ] = a g 1 ( x , y ) + b g 2 ( x , y ) H[af_1(x,y)+bf_2(x,y)]=aH[f_1(x,y)]+bH[f_2(x,y)]=ag_1(x,y)+bg_2(x,y) H[af1(x,y)+bf2(x,y)]=aH[f1(x,y)]+bH[f2(x,y)]=ag1(x,y)+bg2(x,y)
如求和算子Σ

非线性运算
非线性算子如最大值算子

2.6.3 算术运算

在这里插入图片描述
使用图像相加平均/降低噪声:对K幅不同的噪声图像取平均值

使用图像相减比较图像
使用图像相乘/相除校正阴影和模板

2.6.4 集合运算和逻辑运算

在这里插入图片描述
在这里插入图片描述

2.6.5 空间运算

单像素运算
s = T ( z ) s=T(z) s=T(z)
在这里插入图片描述

邻域运算
g ( x , y ) = 1 m n ∑ ( r , c ) ∈ S x y f ( r , c ) g(x,y)=\frac{1}{mn}\sum_{(r,c)\in S_{xy}}f(r,c) g(x,y)=mn1(r,c)Sxyf(r,c)
可进行局部平均

几何空间变换

改变图像中像素的空间排列,通常称为橡皮膜变换,类似于再一块橡皮膜上打印图像,然后根据预定义的一组规则来拉伸或收缩橡皮膜

由两种基本运算组成
(1)坐标的空间变换
(2)灰度内插
仿射变换
在这里插入图片描述
可以用该矩阵来表示所有4个仿射变换:缩放变换,平移变换,旋转变换,剪切变换
在这里插入图片描述
图像旋转和灰度内插
图像配准

2.6.6 向量与矩阵运算

多光谱图像处理
在这里插入图片描述

2.6.7 图像变换

2.6.8 图像灰度和随机变量

本书是数字图像处理经典著作,作者在对32个国家的134个院校和研究所的教师,学生及自学者进行广泛调查的基础上编写了第三。除保留了第二的大部分主要内容外,还根据收集的建议从13个方面进行了修订,新增400多幅图像,200多个图表和80多道习题,同时融入了来本科学领域的重要发展,使本书具有相当的特色与先进性。全书分为12章,包括绪论,数字图像基础,灰度变换与空间滤波,频域滤波,图像复原与重建,彩色图像处理,小波及多分辨率处理,图像压缩,形态学图像处理,图像分割,表现与描述,目标识别。 目录编辑 前言15 致谢19 书籍网站20 关于作者21 第1章引言23 1.1什么是数字图像处理?23 1.2数字图像处理的起源25 1.3使用数字图像处理的字段示例29 1.3.1伽马射线成像30 1.3.2 X射线成像31 1.3.3紫外线带成像33 1.3.4可见光和红外波段成像34 1.3.5微波波段40成像 [1] 1.3.6无线电频段的成像42 1.3.7使用其他成像模式的示例42 1.4数字图像处理的基本步骤47 1.5图像处理系统的组件50 摘要53 参考文献和进一步阅读53 第2章数字图像基础知识57 2.1视觉感知的要素58 2.1.1人眼结构58 2.1.2眼睛中的图像形成60 2.1.3亮度适应和歧视61 2.2光和电磁谱65 2.3图像传感和采集68 2.3.1使用单个传感器进行图像采集70 2.3.2使用传感器条带获取图像70 2.3.3使用传感器阵列进行图像采集72 2.3.4简单的图像形成模型72 2.4图像采样和量化74 2.4.1采样和量化的基本概念74 2.4.2代表数字图像77 2.4.3空间和强度分辨率81 2.4.4图像插值87 2.5像素之间的一些基本关系90 2.5.1像素的邻居90 2.5.2邻接,连通性,区域和边界90 [1] 2.5.3距离措施93 2.6数字图像处理中使用的数学工具简介94 2.6.1数组与矩阵运算94 2.6.2线性与非线性操作95 2.6.3算术运算96 2.6.4设置和逻辑操作102 2.6.5空间操作107 2.6.6矢量和矩阵运算114 2.6.7图像变换115 2.6.8概率方法118 [1] 摘要120 参考文献和进一步阅读120 问题121 第3章强度变换和空间过滤126 3.1背景127 3.1.1强度变换和空间滤波的基础127 3.1.2关于本章中的示例129 3.2一些基本的强度转换函数129 3.2.1图像底片130 3。2。2日志转换131 3.2.3幂律(Gamma)变换132 3.2.4分段线性变换函数137 3.3直方图处理142 3.3.1直方图均衡144 3.3.2直方图匹配(规范)150 3.3.3局部直方图处理161 3.3.4使用直方图统计进行图像增强161 3.4空间过滤的基本原理166 3.4.1空间过滤机制167 3.4.2空间相关和卷积168 3.4.3线性滤波的矢量表示172 3.4.4生成空间滤波器掩码173 3.5平滑空间滤波器174 3.5.1平滑线性滤波器174 3.5.2订单统计(非线性)过滤器178 3.6锐化空间滤波器179 3.6.1基金会180 3.6.2使用二阶导数进行图像锐化 - 拉普拉斯算子182 3.6.3反锐化掩码和高增强滤波184 3.6.4使用一阶导数(非线性)图像锐化 - 梯度187 3.7组合空间增强方法191 [1] 3.8使用模糊技术进行强度变换和空间过滤195 3.8.1引言195 3.8.2模糊集理论的原理196 3.8.3使用模糊集200 3.8.4使用模糊集进行强度变换208 3.8.5使用模糊集进行空间过滤211 摘要214 参考文献和进一步阅读214 问题215 第4章频域滤波221 4.1背景222 4.1.1傅立叶级数和变换的简史222 4.1.2关于本章中的示例223 4.2初步概念224 [1] 4.2.1复数224 4.2.2傅立叶级数225 4.2.3冲动及其筛选性能225 4.2.4一个连续变量函数的傅立叶变换227 4.2.5卷积231 4.3采样和采样函数的傅立叶变换233 4.3.1抽样233 4.3.2采样函数的傅立叶变换234 4.3.3抽样定理235 4.3.4别名239 4.3.5采样数据的功能重建(恢复)241 4.4单变量的离散傅里叶变换(DFT)242 4.4.1从采样函数的连续变换中获取DFT 243 4.4.2采样和频率间隔之间的关系245 4.5扩展到两个变量的函数247 4.5.1二维脉冲及其筛选性质247 4.5.2二维连续傅立叶变换对248 [1] 4.5.3二维采样和二维采样定理249 4.5.4图像中的别名250 4.5.5二维离散傅里叶变换及其逆257 4.6二维离散傅立叶变换的一些性质258 4.6.1空间和频率间隔之间的关系258 4.6.2翻译和轮换258 4.6.3周期259 4.6.4对称性属性261 4.6.5傅里叶谱和相角267 4.6.6二维卷积定理271 4.6.7二维离散傅立叶变换特性总结275 4.7频域滤波的基础277 4.7.1频域的附加特性277 4.7.2频域滤波基础279 4.7.3频域滤波步骤摘要285 4.7.4空域和频域过滤之间的对应关系285 4.8使用频域滤波器进行图像平滑291 4.8.1理想的低通滤波器291 4.8.2巴特沃斯低通滤波器295 [1] 4.8.3高斯低通滤波器298 4.8.4低通滤波的其他例子299 4.9使用频域滤波器的图像锐化302 4.9.1理想的高通滤波器303 4.9.2巴特沃斯高通滤波器306 4.9.3高斯高通滤波器307 4.9.4频域308中的拉普拉斯算子 4.9.5反锐化掩模,高增强滤波和高频强调滤波310 4.9.6同态过滤311 4.10选择性过滤316 4.10.1带通和带通滤波器316 4.10.2陷波滤波器316 4.11实施320 4.11.1二维DFT 320的可分离性 4.11.2使用DFT算法计算IDFT 321 [1] 4.11.3快速傅里叶变换(FFT)321 4.11.4关于过滤器设计的一些评论325 摘要325 参考文献和进一步阅读326 问题326 第5章图像恢复和重建333 5.1图像降级/恢复过程的模型334 5.2噪声模型335 5.2.1噪声的空间和频率特性335 5.2.2一些重要的噪声概率密度函数336 5.2.3周期性噪声340 5.2.4噪声参数估算341 5.3仅存在噪声的情况下的恢复 - 空间过滤344 5.3.1平均滤波器344 5.3.2订单统计过滤器347 5.3.3自适应滤波器352 5.4通过频域滤波定期降低噪声357 5.4.1带状过滤器357 [1] 5.4.2带通滤波器358 5.4.3陷波滤波器359 5.4.4最佳陷波滤波360 5.5线性,位置不变的降级365 5.6估算退化函数368 5.6.1通过图像观察估计368 5.6.2通过实验估算369 5.6.3通过建模估算369 5.7反向过滤373 5.8最小均方误差(维纳)滤波374 5.9约束最小二乘滤波379 5.10几何平均滤波器383 5.11从投影中重建图像384 5.11.1引言384 5.11.2计算机断层扫描原理(CT)387 5.11.3投影和Radon变换390 5.11.4傅立叶切片定理396 5.11.5使用平行光束滤波反投影重建397 5.11.6使用扇束滤波反投影进行重建403 摘要409
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

我怎么对这么多事情都感兴趣

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值