线图中符号识别与定位的图路径袋描述符
1. 引言
如今,图形符号识别与定位已成为重要的研究方向。人们对能有效搜索符号对象的工具需求日益增长,目标是开发高效搜索引擎,从大量集合中找出相似图形对象。形状是描述图像内容的重要视觉特征,但形状表示与描述颇具挑战,因为真实符号常受噪声、缺陷、任意变形和遮挡等影响。
形状表示通常基于形状边界信息或边界与内部内容来寻找有效且具感知重要性的特征。已设计出多种特征,如形状签名、签名直方图、形状不变量、矩、曲率、形状上下文、形状矩阵和光谱特征等。然而,仅依据特征有效性评估形状表示技术是不够的,还需考虑其其他重要特性。
现有众多形状描述符,多数为特定应用而开发。主要形状描述符包括简单几何和拓扑属性,如面积、圆形度、偏心率、凸度、主轴比、圆形方差、主轴方向、弯曲能量及其组合。部分形状描述符基于点特征,利用距离度量实现形状间点的对应;边界矩、时间序列模型(尤其是自回归建模)以及形状签名也用于形状描述。此外,可通过属性图高效表示形状,并利用图匹配和嵌入来衡量图间相似度,但这些操作通常计算成本高,且为应对图像失真,算法需引入噪声模型,进一步增加成本。
本文探索图作为结构表示工具的潜力,提出基于图的形状描述符用于形状识别。该描述符基于对象的图表示,图由二值化图像的矢量化信息构建,将矢量化方法检测到的关键点视为节点,连接节点的线视为边。符号描述依赖图路径的出现情况,图路径(哈密顿路径)是从起始节点到结束节点的有序节点序列,它能捕捉拓扑特征等结构属性,提供图的序列化表示,计算高效,还允许一定程度的结构误差容限。不同图路径在符号中的出现包含重要且具区分性的结构信息,相似符号的路径分布相似,不同符号则不同。
超级会员免费看
订阅专栏 解锁全文
1万+

被折叠的 条评论
为什么被折叠?



