目录
视觉系统中的一个重要问题是从图像中识别代表物体的区域(或子图像),这种对人来说是件非常容易的事,对计算机来说却是令人吃惊的困难.为了将物体区域同图像其它区域分离出来,需要首先对图像进行分割.把图像划分成区域的过程称为分割,即把图像划分成区域,使得每一个区域对应一个候选的物体.通过阈值运算是否可以有效地进行图像分割,取决于物体和背景之间是否有足够的对比度.
1.图像二值化
数字二值图像处理是图像处理领域中的一个重要分支,主要处理那些像素值只有两种可能(通常是0和1)的图像。这种图像通常用于简化分析、降低存储需求以及加快处理速度。在二值图像中,0通常代表背景,而1代表前景或感兴趣的对象。
如果物体灰度值分布在几个不相邻区间内时,阈值化方案可表示为:
将灰度图像或彩色图像转换为二值图像的过程称为二值化。常用的二值化方法有阈值法、Otsu方法等。设定一个阈值T,将像素值大于或等于T的像素设为1,小于T的设为0。
2.几何特性
2.1尺寸和位置
一幅二值图像区域的面积(或零阶矩)由下式给出:
在许多应用中,物体的位置起着十分重要的作用.对于二值图像,物体的中心位置与物体的质心相同,因此可以使用下式求物体的中心位置:
其中x_和y_是区域相对于左上角图像的中心坐标.物体的位置为:
2.2 方向
计算物体的方向比计算它的位置稍微复杂一点.某些形状(如圆)的方向不是唯一的,为了定义唯一的方向,一般假定物体是长形的,其长轴方向被定义为物体的方向.通常,二维平面上与最小惯量轴同方向的最小二阶矩轴被定为长轴.
图像中物体的二阶矩轴是这样一条线,物体上的全部点到该线的距离平方和最小.给出一幅二值图像B[i,j],计算物体点到直线的最小二乘方拟合,使所有物体点到直线的距离平方和最小:
2.3 密集度和体态比
区域的密集度(compact)可用下面的式子来度量:
其中,P和A分别为图形的周长和面积.对于数字图像,A/P2是指物体尺寸(像素点数量)除以边界长度的平方.这是一种很好的散布性或密集性度量方法.这一比值在许多应用中被用作为区域的一个特征.
密集度的另一层意义是:在给定周长的条件下,密集度越高,围成的面积就越大.注意在等周长的情况下,正方形密集度大于长方形密集度. 体态比定义为区域的最小外接矩形的长与宽之比,正方形和圆的体态比等于1,细长形物体的体态比大于1.
3.投影
给定一条直线,用垂直该直线的一簇等间距直线将一幅二值图像分割成若干条,每一条内像素值为1的像素个数为该条二值图像在给定直线上的投影(projection).当给定直线为水平或垂直直线时,计算二值图像每一列或每一行上像素值为1的像素数量,就得到了二值图像的水平和垂直投影,如图所示.由于投影包含了图像的许多信息,所以投影是二值图像的一种简洁表示方式.显然,投影不是唯一的,同样的投影可能对应不同的图像.
在某些应用中,投影可以作为物体识别的一个特征.下面介绍对角线投影的求解方法.对角线投影的关键是计算当前行和列对应的投影分布图位置标号.
4.游程长度编码
游程长度编码(run-length encoding)是另一种二值图像的简洁表示方法,它是用图像像素值连续为1的个数(像素1的长度)来描述图像.这种编码已被用于图像传输.另外,图像的某些性质,如物体区域面积,也可以从游程长度编码直接计算出来.在游程长度编码中经常运用两种方法,一种是使用1的起始位置和1的游程长度,另一种是仅仅使用游程长度,但须从1的游程长度开始描述.
5.距离测量
在许多应用中,找到一幅图像中两个像素点或两个连通成份之间的距离是很有必要的.目前还没有定义数字图像距离的唯一方法,但对所有的像素点p、q和 r,任何距离度量都必须满足下列性质:
6.图像细化
细化(thinning)是一种图像处理运算,可以把二值图像区域缩成线条,以逼近区域的中心线,也称之为骨架或核线.细化的目的是减少图像成份,直到只留下区域的最基本信息,以便进一步分析和识别.细化要求如下:
连通图像区域必须细化成连通线结构.
细化结果最少应该是8-连通(下面将要解释).
保留近似终止线的位置.
细化结果应该近似于中轴线.
由细化引起的附加突刺(短分支)应该是最小的.
细化结果应该保证第一条要求中所定义的连通性,这一点是最基本的要求,它保证了连通线结构的数量等于原始图像中连通区域的数量.第二条要求保证所得到的线条总是含有8-连通图像的最小数量.第三条要求说明终止线位置应该保持不变.细化可以通过迭代方式不断去除边界点来实现,重要的是在迭代过程中不要去除端点像素,因为这样不仅会缩短细化线,丢掉结构信息,而且不能保持其位置不变.第四条要求说明所得线段应能最好地逼近原始区域的中线,如两个像素点宽的竖线或水平线的真正中线应该位于这两个像素之间半个像素间距的位置.在数字图像中表示半个像素间距是不可能的,因此得到的结果是一条位于原直线一侧的直线.第五条要求没有明确指出噪声的影响控制到最低程度,因为判断噪声本身是一件很难的事.一般不希望原始区域含有会引起突刺的隆起,但当某些较大隆起是区域特征时,却必须识别它们.
数字二值图像处理与形状分析是计算机视觉和图像处理中的重要技术。它们通过简化图像数据和提取关键形状特征,为后续的图像理解和分析提供了基础。在实际应用中,这些技术广泛用于文档处理、医学图像分析、安全监控等领域。随着深度学习等新技术的发展,二值图像处理和形状分析的方法也在不断进步和创新。