符号识别与定位竞赛报告
1. 引言
符号识别一直是图形识别领域的热门研究课题,已有多种不同的方法被提出。为了公平地比较各种现有方法,需要一个通用且标准的框架。此前已经组织过多次相关竞赛,而本次竞赛是GREC系列竞赛的第四版,具有三个主要创新点:
- 生成了用于孤立符号识别的新图像集,包含盲测,旨在评估方法的可扩展性。
- 创建了新的测试类型,使用从真实图纸中直接裁剪的符号图像,以评估在无法完美分割符号时的识别性能。
- 首次引入符号定位评估,利用了最近在数据集创建和指标定义方面的工作。
2. 数据集
本次竞赛使用了与之前GREC竞赛相同的150个符号集,为符号识别和符号定位创建了不同的数据集。
2.1 符号识别
过去的竞赛已经生成了用于孤立符号识别的数据集,但为了弥补一些不足并提供更通用的测试集,本次设计了新的数据集,目标如下:
- 评估方法的可扩展性。
- 测试方法在实际增加的退化情况下的性能。
- 测试方法的通用性。
为此,生成了三组图像,每组包含的符号数量逐渐增加(50、100和150)。对于每个测试,为每个符号合成生成50张具有不同退化的图像。退化生成使用了Kanungo等人提出的二进制退化方法,具体如下:
- 首先,对符号的理想图像应用轻微的二进制退化,生成基本图像。
- 基于基本图像,生成具有旋转、缩放以及旋转和缩放组合的图像(训练集#1至#3)。
- 根据Kanungo方法的不同参数设置,生成更多退化图像。改变参数α可生成线条变细的图像;参数β可模拟线条变粗;参数η影响全局噪声水平。
- 为了测试方法
超级会员免费看
订阅专栏 解锁全文

41

被折叠的 条评论
为什么被折叠?



