MPEG - 7与形状特征在图像检索中的应用解析
在多媒体数据爆炸式增长的今天,如何高效地对多媒体内容进行索引、搜索和过滤成为了一个关键问题。MPEG - 7标准应运而生,它为多媒体内容描述提供了一个强大的工具,同时形状特征在图像检索中也有着重要的应用。下面我们将详细介绍MPEG - 7的相关描述工具以及形状特征的提取和表示方法。
1. MPEG - 7视觉描述工具
MPEG - 7提供了一系列的视觉描述工具,用于对多媒体数据的不同方面进行描述,以下是一些主要的描述工具:
- 纹理描述 :感知浏览描述符(Perceptual Browsing Descriptor,PBD)用于粗粒度的纹理浏览。它非常紧凑,最多只需12位。PBD从纹理模式的规则性、粗糙度和方向性等方面提供了类似于人类感知的纹理特征描述,并且由于它与人类的感知密切相关,还可以手动实例化。
- 形状描述
- 形状频谱 - 3D形状描述符 :基于形状索引值对3D网格模型进行内在形状描述。MPEG - 7的3D形状描述符基于形状频谱的概念,形状频谱是形状索引在整个3D表面上的直方图。默认情况下,描述符使用100个区间的直方图,每个区间用12位表示,此外还使用两个额外的变量来构成描述符,分别表示网格平面表面区域的相对面积和无法可靠估计形状索引的多边形组件的相对面积。
- 角径向变换(Angular Radial Transformation,ART) :基于区域的描述符,用于表达2D对象区域内的像素分布。它可以描述由多个不相连区域组成的复杂对象,以及有或
超级会员免费看
订阅专栏 解锁全文
21

被折叠的 条评论
为什么被折叠?



