基于内容的图像检索全解析
1. 图像形状特征
图像的形状特征通常在图像被分割成区域或对象后进行描述。不过,由于难以实现鲁棒且准确的图像分割,形状特征在图像检索中的应用目前主要局限于对象或区域易于获取的特定场景。
形状描述的先进方法可分为基于边界和基于区域两类:
| 类型 | 具体方法 |
| ---- | ---- |
| 基于边界 | 直线形状、多边形近似、有限元模型、基于傅里叶的形状描述符 |
| 基于区域 | 统计矩 |
一个好的物体形状表示特征应具有平移、旋转和缩放不变性。下面介绍几种常用于图像检索的形状特征:
- 矩不变量 :经典的形状表示使用一组矩不变量。每个对象由一个14维特征向量表示,包含两组归一化矩不变量,一组来自对象轮廓,另一组来自其实心对象轮廓。基于这些矩,可以推导出一组对平移、旋转和缩放不变的矩不变量。
- 转向角 :二维对象的轮廓可以表示为连续边界像素的闭合序列。转向函数或转向角根据对象轮廓上的参考点,将逆时针切线的角度作为弧长的函数进行测量。但这种表示方法会因对象旋转和参考点选择的不同而变化。因此,在比较对象A和B的形状相似度时,需要计算所有可能的平移和旋转下的最小距离。
- 傅里叶描述符 :傅里叶描述符通过对对象边界进行傅里叶变换来描述其形状。将二维对象的轮廓视为连续边界像素的闭合序列,可以定义三种轮廓表示:曲率、质心距离和复坐标函数。这三种轮廓表示的傅里叶变换生成三组复系数,在频域中表示对象的形状。低频系数描述一般形状属性,高频系数反映形状细节。为实现旋转不变性,只使
超级会员免费看
订阅专栏 解锁全文
1774

被折叠的 条评论
为什么被折叠?



