基于泽尔尼克矩的形状描述符在模式识别与分类中的应用
1. 引言
模式识别与分类领域近年来发展迅速,在机器视觉、生物识别、医学成像、光学字符识别、语音识别、遥感和生物信息学等领域都有广泛应用。该过程涵盖数据感知、预处理、特征提取、识别和分类等步骤,其中用特定特征对图像进行表示和描述对于模式识别和分析问题至关重要。形状作为重要的视觉特征,能有效捕捉图像的整体和结构信息。形状描述符主要分为基于边界的描述符和基于区域的描述符。
基于边界的描述符利用边界信息,包括形状签名、全局描述符和光谱描述符等。全局描述符如周长、偏心率、圆形度等适用于区分差异较大的形状,常用于过滤;光谱描述符中,低频分量捕捉全局特征,高频分量捕捉增强特征。但基于边界的描述符无法捕捉图像的内部内容,当边界不连续时效果不佳。
基于区域的描述符考虑形状区域内的所有像素,包括面积、欧拉数、凸包、形状矩阵和矩描述符等。矩描述符基于从图像像素中提取统计分布,具有对图像旋转、缩放和平移不变的特性,对图像识别和分类方法具有重要意义。
2. 矩不变量综述
矩是将图像函数投影到多项式基函数上得到的,可作为基于区域的形状描述符用于各种应用。常见的矩类型包括几何矩、代数矩和正交矩。
2.1 几何矩
几何矩由Hu于1962年引入,对平移、旋转和缩放具有不变性。对于数字图像$f(x, y)$,其$(p + q)$阶几何矩定义为:
[m_{pq}=\sum_{x}\sum_{y}x^p y^q f(x, y)]
几何矩在飞机类型识别、掌纹识别等领域有应用。但计算高阶几何矩计算量较大,且低阶几何矩不足以准确描述形状,其基集$x^p y
超级会员免费看
订阅专栏 解锁全文
43

被折叠的 条评论
为什么被折叠?



