图像处理的基础知识
数字图像处理简介
什么是数字图像处理
数字图像处理是通过计算机对图像进行处理的理论、方法、技术
什么是图像?
图像是一个二维函数𝑓(𝑥,𝑦),其中,𝑥,𝑦是空间坐标,𝑓(𝑥,𝑦)是点(𝑥,𝑦)的幅值。
灰度图像是一个二维灰度(或亮度)函数𝑓(𝑥,𝑦)
彩色图像由三个(如𝑅𝐺𝐵,𝐻𝑆𝑉)二维灰度(或亮度)函数𝑓(𝑥,𝑦)组成
什么是数字图像
像素组成的二维排列,可以用矩阵表示
图像的表示
单色(灰度)图像:
每个像素的亮度用一个数值来表示,通常数值范围在0到255之间,0表示黑、255表示白,其它值表示处于黑白之间的灰度。
彩色图像:
用红、绿、蓝三元组的二维矩阵来表示。 通常,三元组的每个数值也是在0到255之间,0表示相应的基色在该像素中没有,而255则代表相应的基色在该像素中取得最大值
什么是像素
数字图像由二维的元素组成,每一个元素具有一个特定的位置(𝑥,𝑦)和幅值𝑓(𝑥,𝑦),这些元素就称为像素(𝑝𝑖𝑥𝑒𝑙)或者像元。
数字图像的研究内容
数字图像处理的目的:
提高图像的视感质量,赏心悦目
例如:去除噪声、图像增强、几何变换
提取图像中的某些特征,便于分析
例如:模式识别、计算机视觉的预处理等
对图像数据进行变换
频域变换;频域滤波
数字图像处理的内容:
1)图像获取、表示和表现
数字化过程主要包括摄取图像、光电转换及数字化等几个步骤
2)图像增强
突出图像中的某些“有用”信息,同时削弱另外一些“无用”信息的图像处理方法。
3)图像复原
复原技术:是基于模型和数据的图像恢复,其目的是消除退化的影响,对图像进行校正。
难点:建立复原模型。
4)图像重建
图像重建:是指从数据到图像的处理,CT就是典型应用实例。
与计算机图形学结合,把多个二维图像合成并加以光照模型和各种渲染技术形成三维图像。
5)图像压缩
图像压缩:指用较少的比特有损或无损的表示原来的像素矩阵的技术,也称为图像编码。
图像编码的目的:
减少数据存储量(降低成本);
降低数据率以减少传输带宽;
便于特征提取。
计算机视觉简介
什么是计算机视觉
计算机视觉又常称机器视觉,它是一门研究通过图像或视频数据观察周围世界的学科,主要以摄像机拍摄的图像或视频为原始数据,提取出在图像或视频中能观察到的事物
计算机视觉与数字图像处理的区别
机器视觉偏重于计算机视觉技术工程化,能够自动获取和分析特定的图像,以控制相应的行为。计算机视觉采用图像处理、模式识别、人工智能技术相结合的手段,着重于一幅或多幅图像的计算机分析。
具体来说,计算机视觉为机器视觉提供图像和景物分析的理论及算法基础,机器视觉为计算机视觉的实现提供传感器模型、系统构造和实现手段。
计算机视觉的研究领域
研究内容分为5个方面:输入设备、底层视觉、中层视觉、高层视觉以及体系结构。
输入设备(input device):
输入设备的研制,包括成像设备和数字化设备。成象设备是指通过光学摄像机或红外、激光、超声、X射线对周围场景或物体进行探测成象,得到关于场景或物体的二维或三维数字化图像。
底层视觉(Low-level Vision):
主要是对输入的原始图像进行处理。
该过程借用了大量的图像处理技术和算法,如图像滤波、图像增强、边缘检测等,以便从图像中抽取诸如角点、边缘、线条、边界以及色彩等关于场景的基本特征。
该过程还包含了各种图像变换(如校正)、图像纹理检测、图像运动检测等
中层视觉(Mid-level Vision):
主要任务是恢复场景的深度、表面法线方向、轮廓等有关场景的2.5维信息。实现的途径有立体视觉(Stereo Vision)、测距成像(Range Finder)、运动估计(Motion Estimation)等方法。系统标定、系统成像模型等研究内容一般也是在这个层次上进行的。
高层视觉(High-level Vision):
在以物体为中心的坐标系中,在原始输入图像、图像基本特征、2.5维图的基础上—中底层视觉研究的基础上,恢复物体的完整三维图,简历物体三维描述,识别三维物体并确定物体的位置和方向。
体系结构(System Architecture):
在高度抽象的层次上,根据系统模型而不是根据实际设计的具体例子来研究系统的结构。
体系结构研究涉及一系列相关的课题:并行结构、分层结构、信息流结构、拓扑结构以及从设计到实现的途径等
re):
在高度抽象的层次上,根据系统模型而不是根据实际设计的具体例子来研究系统的结构。
体系结构研究涉及一系列相关的课题:并行结构、分层结构、信息流结构、拓扑结构以及从设计到实现的途径等