基于Zernike矩的形状描述符在模式识别与分类中的应用
1. 引言
模式识别与分类领域在机器视觉、生物识别、医学成像等众多领域得到了广泛应用。在这个过程中,图像的表示和描述至关重要,而形状作为一种重要的视觉特征,能够有效捕捉图像的整体和结构信息。形状描述符主要分为基于边界的描述符和基于区域的描述符。
1.1 基于边界的描述符
- 形状签名 :利用边界的特定特征来描述形状。
- 全局描述符 :如周长、偏心率、圆形度等,适用于区分差异较大的形状,常用于过滤操作。
- 光谱描述符 :低频分量捕捉全局特征,高频分量捕捉增强特征。但这类描述符无法捕捉图像的内部内容,当边界不连续时,信息不完整。
1.2 基于区域的描述符
考虑形状区域内的所有像素,包括面积、欧拉数、凸包、形状矩阵和矩描述符等。其中,矩描述符基于从图像像素中提取统计分布,具有对图像旋转、缩放和平移不变的特性,对图像识别和分类方法具有重要意义。
2. 矩不变量综述
矩是将图像函数投影到多项式基函数上得到的,可作为区域形状描述符用于各种应用。常见的矩类型包括几何矩、代数矩和正交矩。
2.1 几何矩
Hu于1962年引入的几何矩对平移、旋转和缩放具有不变性。对于数字图像$f(x, y)$,其$(p + q)$阶几何矩定义为:
[m_{pq} = \sum_{x}\sum_{y} x^p y^q f(x, y)]
超级会员免费看
订阅专栏 解锁全文
29

被折叠的 条评论
为什么被折叠?



