多媒体内容描述与形状特征解析
1. MPEG - 7 视觉描述工具
MPEG - 7 作为多媒体内容描述标准,提供了一个可互操作的元数据系统,能基于内容对多媒体数据进行快速有效的索引、搜索和过滤,在标准基于内容的图像检索(CBIR)系统的描述符设计中非常有用。下面详细介绍其视觉描述工具。
1.1 纹理相关描述符
感知浏览描述符(Perceptual Browsing Descriptor,PBD)用于粗粒度的纹理浏览。它非常紧凑,最多只需 12 位。该描述符能从纹理模式的规则性、粗糙度和方向性等方面,提供与人类感知相似的纹理特征描述,并且由于与人类感知密切相关,还可以手动实例化。
1.2 形状描述符
- 形状频谱 - 3D 形状描述符 :基于形状索引值对 3D 网格模型进行内在形状描述。MPEG - 7 的 3D 形状描述符基于形状频谱概念,形状频谱是在整个 3D 表面上计算的形状索引直方图。对于 3D 网格,为每个顶点计算形状索引,它对缩放和欧几里得变换具有不变性。默认情况下,描述符使用 100 个区间的直方图,每个区间用 12 位表示,还使用两个额外变量构成描述符,分别表示网格平面区域的相对面积和无法可靠估计形状索引的多边形组件的相对面积。
- 角径向变换(Angular Radial Transformation,ART) :基于区域的描述符,用于表达 2D 对象区域内的像素分布,能描述由多个不相连区域组成的复杂对象,以及有或没有孔洞的简单对象。其重要特性包括:能紧凑高效地同时描述多个不相交区域的属性;在分割过程中对象被分割成不相连的子区
超级会员免费看
订阅专栏 解锁全文
2303

被折叠的 条评论
为什么被折叠?



