符号识别与行政文档分类技术研究
在当今数字化的时代,符号识别和行政文档分类在众多领域都有着至关重要的应用。符号识别技术可以帮助我们在图纸、图像等中准确识别各种符号,而行政文档分类则能提高企业处理大量文档的效率。下面我们将详细探讨这两方面的技术及其性能评估。
符号识别性能评估
为了评估符号识别系统的性能,我们使用了公开可用的 GREC’05 和 GREC’11 竞赛数据集。这两个数据集都有一个包含 150 个从建筑和电气图纸中分割出来的符号库,这些符号由线条和圆弧组成。
- GREC’05 数据集 :测试图像用于孤立识别,并且用 6 种不同的噪声类型和不同的变换(旋转和/或缩放)进行了退化处理。
- GREC’11 数据集 :既有孤立识别测试,也有符号定位测试。在孤立识别测试中,测试图像同样经过了变换和退化处理,有 3 种噪声类型,每种类型最多有 25 级退化,这些噪声类型模拟了现实世界中的噪声(由于扫描等原因)。符号定位训练集有 20 张建筑图纸和 20 张电气图纸,也受到 3 种不同噪声类型的破坏,任务是在这些图纸中定位查询符号。
实验结果
- 孤立识别性能 :我们在 GREC’05 数据集的所有测试以及 GREC’11 测试的一个随机子集上评估了我们的系统。使用识别准确率指标进行评估,结果如下表所示:
| 数据集 | 噪声类型 | 无变 |
|---|
超级会员免费看
订阅专栏 解锁全文
1532

被折叠的 条评论
为什么被折叠?



