交互式模式下的口语对话系统与图形文档图像中的符号定位
口语对话系统新进展
在交互式模式识别框架下,提出了一种新的公式来对口语对话系统(SDS)进行建模。该公式对交互式模式识别(IPR)方法进行了扩展,涵盖了基于语音和文本的对话系统、解码以及SDS与决策理论之间的关系,还定义了基于IPR范式的用户模型。
通过将该公式应用于一个初步的图形模型,处理管理器策略和用户行为,并在西班牙对话任务上进行初步评估,结果表明这个公式是一个很有前景的处理SDS的框架。未来的工作包括选择替代的平滑方案以处理更复杂的错误恢复策略,同时通过适当的损失函数来定义更复杂的对话管理器策略和模拟用户模型行为。
图形文档图像中的符号定位
符号定位是在大量图形文档中找到给定查询符号的过程,在图形识别领域受到越来越多的关注。例如在工程图纸数据库中查找机械零件,或从大量文档数据库中通过特定标志检索供应商的发票。然而,现实世界中的文档常受到各种噪声干扰,使得符号定位变得困难。
由于图是表示图形元素(特别是线图)的有效工具,因此在以图表示的线图中,符号定位问题可转化为子图匹配问题,图论为解决该问题提供了强大的方法。
现有方法的局限性
目前已有多种用于图形文档中符号定位的方法,但这些方法在处理节点断开连接等情况时存在不足,往往会丢失图的一些拓扑特征。因此,提出了一种层次图表示方法,以处理从低级到图级的各种误差。
层次图表示
- 矢量化 :文档的图表示需要经过一些预处理步骤,矢量化是其中之一,它将二值图像近似为多边形表示。在本方法中,使用Rosin -
超级会员免费看
订阅专栏 解锁全文
2085

被折叠的 条评论
为什么被折叠?



