数字图像处理基本概念

本文介绍了数字图像处理的基本概念,包括图像的定义、用途、处理步骤和组成。内容涵盖图像的取样和量化、灰度变换、空间滤波以及傅里叶变换。还讨论了图像的视觉感知、低级到高级处理的区别、图像预处理和增强,以及在不同领域的应用,如医学成像和计算机视觉。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

数字图像处理

绪论

概念

一副图像可定义为一个二维函数 f ( x , y ) f(x,y) f(x,y),其中 x x x y y y是空间平面的坐标,而幅值 f f f成为图像在该点处的强度和灰度。

  • x x x y y y f f f是有限的离散数值时,我们称图像为数字图像。
  • 数字图像处理是指借助于数字计算机来处理数字图像。

从图像处理到计算机视觉的这个连续统一体内并没有明确的界限。然而,一种有用的范例是在这个连续的统一体中考虑三种典型的计算处理,即低级、中级和高级处理。

  • 低级处理涉及初级操作如降低噪声的图像预处理、对比度增强和图像尖锐化。低级处理以输入、输岀都是图像为特征。中级处理涉及诸多任务,譬如把一幅图像分为不同区域或目标的)分割,减少这些目标物的描述,以使其更适合计算机处理及对不同目标的分类(识别)。
  • 中级图像处理以输入为图像但输出是从这些图像中提取的特征(如边缘、轮廓及各物体的标识等)为特点。
  • 高级处理涉及“理解”已识别目标的总体,就像在图像分析中那样,以及在连续统一体的远端执行与视觉相关的认知功能。

用途

  • 伽马射线成像
  • X射线成像
  • 紫外波段成像
  • 可见光及红外波段成像
  • 微波波段成像
  • 无线电波段成像

基本步骤

image-20201004110216402

  1. 图像获取与给出一幅数字形式的图像一样简单。包括图像预处理,譬如图像缩放。
  2. 图像增强是对一幅图像进行某种操作,使其结果在特定应用中比原始图像更适合进行处理。
  3. 图像复原是改进图像外观的一个处理领域。与图像增强不同的是,图像增强是主观的,而图像复原是客观的。复原技术倾向于以图像退化的数学或概率模型为基础。另一方面,增强的效果是以人的主观判断为基础的。
  4. 彩色图像处理也是提取图像中感兴趣特征的基础
  5. 小波是以不同分辨率来描述图像的基础。
  6. 形态学处理设计提取图像分享的工具。
  7. 分割过程将一幅图像划分为他的组成部分或目标。自动分割是数字图像处理中最困难的任务之一。
  8. 表示与描述几乎总是在分割阶段的输出之后,通常这一阶段是未加工的像素数据,这些数据不是构成一个区域的边界,就是构成该区域本身的所有点。
  9. 识别是基于目标的描述给该目标赋予标志的过程。

组成

image-20201004111001789

数字图像基础

视觉感知要素

image-20201004111322300

image-20201004111340347

视网膜图像主要聚焦在中央凹区域。然后,光接收器的相对刺激作用产生感知,把辐射能转变为电脉冲,最后由大脑解码。

image-20201004111620602

图像感知和获取

image-20201004112021579

取样和量化

一幅图像的x和y坐标及幅度可能都是连续的。为将它转换为数字形式,必须在坐标上和幅度上都进行取样操作。对坐标值进行数字化称为取样,对幅值数字化称为量化。

image-20201004112135323

空间分辨率是图像中可辨别的最小细节的度量。其中每单位距离线对数和每单位距离点数(像素数)是最通用的度量。

灰度分辨率是指在灰度级中可分辨的最小变化

图像内插

  1. 最近邻内插法。这种方法把原图像中最近邻的灰度赋给了每个新位置
  2. 双线性内插(不是线性) v ( x , y ) = a x + b y + c x y + d v(x,y)=ax+by+cxy+d v(x,y)=ax+by+cxy+d其中,4个系数可由4个用 ( x , y ) (x,y) xy点最近邻点写出的未知方程确定。
    • 双线性内插给出了比最近邻内插好得多的结果,但随之而来的是计算量的增加。
  3. 双三次内插 v ( x , y ) = ∑ i = 0 3 ∑ j = 0 3 a i j x i y j v(x,y)=\sum_{i=0}^{3}\sum_{j=0}^{3}a_{ij}x^iy^j v(x,y)=i=03j=03aijxiyj
    • 16个系数可由16个用 ( x , y ) (x,y) (x,y)点最近邻点写出的未知方程确定。如果求和的上下限分别为0和1,则其简化为双线性内插的形式。
    • 通常,双三次内插在保持细节方面比双线性内插相对要好。双三次内插是商业图像编辑程序的标准内插方法。
  4. 样条、小波

像素的一些基本关系

三种类型的邻接

  • 4邻接。如果q在集合 N 4 ( p ) N4(p) N4(p)中,则具有V中数值的两个像素p和q是4邻接的。
  • 8邻接。如果q在集合 N 3 ( p ) N3(p) N3(p)中,则具有V中数值的两个像素p和q是8邻接的。
  • m m m邻接(混合邻接)。如果 q q q N 4 ( p ) N4(p) N4(p)中,或 q q q N D ( p ) N_D(p) ND(p)(p的四个对角相邻像素)中,且集合 N 4 ( p ) ∩ N 4 ( q ) N4(p)∩N4(q) N4(p)N4(q)中没有来自 V V V中数值的像素,则具有 v v v中数值的两个像素 p p p q q q m m m邻接的。

混合邻接是8邻接的改进。混合邻接的引入是为了消除采用8邻接时产生的二义性。

距离度量

image-20201004150109345

  • image-20201004150119345
  • image-20201004150135698
  • image-20201004150145458image-20201004150151410

数字图像处理中所用数学工具

image-20201004152010705

image-20201004151955841

灰度变换和空间滤波

基础

滤波器又称 空间滤波器、空间掩膜、核、模板、窗口

一些基本的灰度变换函数

s和r分别代表处理前后的像素值。

图像反转

s = L − 1 − r s=L-1-r s=L1r

对数变换

s = c l o g ( 1 + r ) s = clog(1+r) s=clog(1+r)

image-20201004152847424

幂律(伽马)变换

s = c ( r + ε ) γ s=c(r+ \varepsilon)^{\gamma} s=c(r+ε)γ

通常 ε \varepsilon ε为0

image-20201004153209103

分段线性变换函数

  • 对比度拉伸image-20201004154532243

  • 灰度级分层image-20201004154637055

  • 比特平面分层image-20201004155135085image-20201004155159261

    很明显,4个高阶比特平面,特別是最后两个比特平面,包含了在视觉上很重要的大多数数据。低阶比特平面在图像中贡献了更精细的灰度细节。

    3.14 ( a ) 3.14(a) 3.14(a)的最低边界的中部。从最高阶平面开始,这些比特平面中的相应像素的值分别为11000010,它是十进制数194的二进制表示。原图像中任意一个像素的值,可以类似地由这些比特平面中对应的二进制像素值来重建

    我们可以得出这样的结论:存储4个高阶比特平面将允许我们以可接受的细节来重建原图像。存储这4个平面代替原始图像可减少50%的存储量(不考虑存储体系结构问题)

直方图处理

直观上,可以得出这样的结论:若一幅图像的像素倾向于占据整个可能的灰度级并且分布均匀,则该图像会有高对比度的外观并展示灰色调的较大变化。最终效果将是一幅灰度细节丰富且动态范围较大的图像。

  • PDF:概率密度函数(probability density function), 在数学中,连续型随机变量的概率密度函数(在不至于混淆时可以简称为密度函数)是一个描述这个随机变量的输出值,在某个确定的取值点附近的可能性的函数。img

  • PMF : 概率质量函数(probability mass function), 在概率论中,概率质量函数是离散随机变量在各特定取值上的概率。

    imgimg

  • CDF : 累积分布函数 (cumulative distribution function),又叫分布函数,是概率密度函数的积分,能完整描述一个实随机变量X的概率分布。

灰度级范围为 [ 0 , L − 1 ] [0,L-1] [0,L1]的数字图像的直方图是离散函数 h ( r k ) = n k h(r_k)=n_k h(rk)=nk,其中 r k r_k rk是第 k k k级灰度值, n k n_k nk是图像中灰度为的像素个数。

image-20201004160746077

直方图均衡化

image-20201004164659991image-20201004164610535image-20201004164549016

剩下的看书看的不太懂了,看了以下的博客

直方图均衡化例子

直方图均衡化、规定化、局部直方图、直方图统计

image-20201004204641670

image-20201004204757733

滤波基础

滤波一词借用于频域处理,频率域处理是下一章的主题,在下一章中,“滤波”是指接受(通过)或拒绝一定的频率分量。例如,通过低频的滤波器称为低通滤波器。低通滤波器的最终效果是模糊(平滑)一幅图像。我们可以用空间滤波器(也称为空间掩模、核、模)直接作用于图像本身而完成类似的平滑。

一般来说,使用大小为 m ∗ n m*n mn的滤波器对大小为 M ∗ N M*N MN的图像进行线性空间滤波,可由下式表示

image-20201004210136562

相关和卷积

相关是滤波器模板移过图像并计算每个位置乘积之和的处理。卷积的机理相似,但滤波器首先要旋转180°。

image-20201004210619090

平滑空间滤波器

平滑滤波器用于模糊处理和降低噪声。

模糊处理经常用于预处理任务中,例如在(大)目标提取之前去除图像中的一些琐碎细节,以及桥接直线或曲线的缝隙。通过线性滤波和非线性滤波模糊处理可以降低噪声。

平滑线性滤波器

平滑线性空间滤波器的输出(响应)是包含在滤波器模板邻域内的像素的简单平均值。这些滤波器有时也称为均值滤波器。

image-20201004211548502

傅里叶

如何理解傅里叶变换公式? - 苗华栋的回答 - 知乎 https://www.zhihu.com/question/19714540/answer/1119070975

如何理解傅立叶级数公式?–马同学

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值