基于部件的多尺度符号识别方法
在符号识别领域,对于那些与其他图形元素相连或相交的非分割符号的识别是一个具有挑战性的问题。本文将介绍一种基于多尺度空间金字塔表示和随机森林集成分类器的符号识别方法,该方法能够有效处理受干扰的符号。
1. 多尺度金字塔表示与特征提取
多尺度分析是解决许多视觉问题的有效方法,在符号识别中,我们构建了类似的多尺度空间金字塔表示来描述符号。
1.1 空间金字塔构建
将符号图像区域沿 x 和 y 轴连续分割成更细的子区域,形成空间嵌套的符号块层次结构,即符号补丁。假设构建一个 L 级四叉树金字塔,每个上层补丁被分割成 4 个宽度和高度为一半的子补丁。第 i 级的所有补丁集合为:
[P_i = {p_{i1}, p_{i2}, …, p_{iN_{P,i}}}, N_{P,i} = 4^{L - i}]
其中,补丁数量 (N_{P,i}) 随级别降低而减少,(p_{L1}) 对应整个符号图像区域,(p_{1j}) 处于最细级别。每个补丁的大小 ([D_{ih}, D_{iw}]) 随级别增加而增大:
[D_{ih} = \frac{D_H}{2^{L - i}}, D_{iw} = \frac{D_W}{2^{L - i}}]
这里,(D_H) 和 (D_W) 分别是符号图像的高度和宽度。
这种金字塔表示通过各层补丁的空间组织对符号的多尺度结构信息进行编码,其基本思想是将符号分解为足够小的补丁,以隔离不受其他相交图形对象影响的部分。因为整个受干扰符号的形状特征分布方差通常较高,难以进行整体形状匹配;而小补丁对不同符号类别的区分能力较弱,需要复杂的分类模型。
以
超级会员免费看
订阅专栏 解锁全文
314

被折叠的 条评论
为什么被折叠?



