图像预处理与特征提取技术详解
1. 逐像素变换
1.1 局部二值模式(LBP)
局部二值模式(LBP)是一种用于描述图像局部纹理特征的方法。其基本原理是将中心像素与它的八个邻域像素进行比较。若某个邻域像素的值大于或等于中心像素的值,则该位置对应的二进制值设为 1,否则设为 0。这八个二进制值组合起来就形成了一个 8 位的数字。
LBP 还可以扩展到更大的区域。通过将当前像素与圆周上的(插值后的)图像位置进行比较,这种扩展的 LBP 由样本数量 P 和圆的半径 R 来表征。在实际应用中,某些特定的 LBP 模式(如 00111111)出现的频率较高。通过将所有非均匀的 LBP 模式聚合为一个类别,可以进一步减少纹理类别的数量。这样,局部图像结构就被分为九种 LBP 类型,包括八种旋转不变的均匀模式和一种非均匀类别。
此外,LBP 算子可以使用不同大小的邻域。由于圆周上的位置通常不会恰好与像素网格重合,因此需要使用双线性插值来估计这些位置的强度。这种扩展的 LBP 算子能够捕捉图像中不同尺度的纹理信息。
1.2 纹理基元图(Texton maps)
纹理基元(Texton)这一概念源于人类感知研究,它指的是纹理的基本感知元素,类似于语音识别中的音素。在机器视觉领域,纹理基元是一个离散变量,用于表示当前像素周围区域中存在的有限数量的可能纹理类别之一。纹理基元图则是在每个像素处计算纹理基元的图像。
纹理基元的分配依赖于训练数据。具体步骤如下:
1. 使用一组 N 个滤波器对一组训练图像进行卷积操作。
2. 将每个训练图像中每个像素位置的响应连接起来,形成一个 N×1 的向量。
图像特征提取技术详解
超级会员免费看
订阅专栏 解锁全文
2370

被折叠的 条评论
为什么被折叠?



