基于几何匹配的孤立符号识别与符号定位
1. 引言
在文档图像分析领域,图形识别是一个具有挑战性的问题。它涉及处理线图中出现的图形实体,如建筑和电气符号等。这些符号的定位和识别对于检索应用等非常重要。目前已经有很多关于孤立符号识别的有价值的工作,并且识别上下文中符号的方法也在不断增加。然而,到目前为止提出的解决方案还不能可靠地应用于现实世界的应用中,如技术图纸的自动分析或数字图书馆中的基于查询的检索。
本文介绍了使用几何匹配技术来识别孤立符号和上下文中的符号。系统首先应用一个受相关工作启发的自适应预处理算法进行去噪。之后,对于符号或线图的表示,可以使用像素或矢量基元作为特征。对于图像对(查询图像和数据库图像)的匹配,使用了几何匹配框架。
与之前的初步工作相比,本文有以下主要扩展:
- 几何匹配框架得到了推广,不仅可以处理像素,还能处理矢量基元,如直线和弧线。这使得可以灵活地使用统计或结构表示来表示符号,并且由于直线和弧线等特征的数量比像素表示中的数量少得多,因此加快了匹配速度。
- 改进了几何匹配框架,以处理非常相似的形状。通过对未匹配的特征进行惩罚,有助于识别形状是其他符号形状子集的符号。
- 系统中添加了自适应预处理模块,以处理包括干净图像在内的不同类型的噪声。
- 对孤立符号识别和符号定位进行了大规模的实验和基准测试。
2. 相关工作
孤立符号识别方法可以分为结构方法、统计方法和混合方法。下面回顾一些使用几何技术进行特征提取、匹配和识别的方法:
|方法|具体操作|
| ---- | ---- |
|Coustaty等人的方法|使用自适应霍夫变换提取符号的线段,并将
超级会员免费看
订阅专栏 解锁全文
5323

被折叠的 条评论
为什么被折叠?



