交互式草图识别的增量学习
1. 引言
在现代技术文档的处理中,如建筑平面图、工程图纸等,将这些文档映射为数值形式变得尤为重要。这不仅有助于文档的自动化处理,还能提升文档的可读性和可编辑性。为了实现这一目标,本文探讨了一种交互式的、自动演化的解决方案,旨在统一纸质文档识别和笔式草图解释。这种解决方案不仅能够处理静态文档,还能应对实时草图输入,为用户提供更加灵活和高效的工具。
2. 交互式广度优先探索
现有的交互式结构化文档解释方法(IMISketch)基于以下特征:
- 文档的先验结构知识 :通过基于产生式规则的视觉语言表达。
- 二维降序广度优先分析 :逐层探索文档结构。
- 空间上下文焦点 :限制组合爆炸,提高分析效率。
- 不确定性形式化 :为每个假设分配分数,量化不确定性。
- 用户参与 :在局部上下文中无法自动解决歧义时,请求用户介入。
这些特征共同确保了与分析系统的最佳互动性,尤其是在复杂文档上,用户参与能够避免分析步骤中的错误累积,从而提高识别的准确性。
2.1 分析过程
分析过程如图1所示,包括以下几个步骤:
- 提取必要信息 :从结构化文档中提取线段,作为分析的原语。
- 定义空间上下
超级会员免费看
订阅专栏 解锁全文
717

被折叠的 条评论
为什么被折叠?



