符号识别与图近似中的关键技术研究
符号识别实验
在符号识别领域,我们采用了一种新的方法进行实验评估,使用的是SESYD(平面图)数据库。该数据库是一个合成生成的图形文档基准,包含10个不同的子数据集,每个子数据集由100个不同的合成生成平面图和16个模型符号组成。
在本次工作中,我们选取了其中一个子数据集,并随机选择了8个查询符号。所有子数据集中的平面图都是基于同一个平面图模板创建的,通过在不同位置以随机方向和比例放置不同的模型符号。查询符号是理想的,不包含任何失真。查询图和输入图的平均节点数分别为12和1500。
由于我们关注的是文档检索方面的问题,因此使用标准的性能指标,如精度、召回率和F值,来评估我们系统的性能。尽管图像集是合成生成的,但矢量化算法会产生一些失真,如节点之间的断开、虚假节点的插入等。本次实验的目的是观察算法在中等规模数据库中处理这些失真的表现。
实验结果以符号为单位展示在表1中,结果显示该方法并非对所有符号都同样成功,特别是对于具有简单节点的简单符号,如sofa1。这是因为表示这些符号的图的节点与不属于该符号的平面图中的节点具有相似的属性。总体而言,算法的精度相当不错,这确保了系统在检索时的可信度。召回率值因符号而异,但在大多数情况下是令人满意的,这意味着系统能够检索到大多数查询符号的实例。
| Symbol | Precision | Recall | F-measure | Symbol | Precision | Rec |
|---|
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



